68user's page 掲示板

Prev< No. 2105〜2115> Next  [最新発言に戻る] [過去ログ一覧]
No. 2105 # ふくし [E-mail] 2001/08/18 (土) 12:08:21
Perl一般の質問ですみません。
さいきん Word が作った RTF をパースしないといけないハメになったんですが、
VBA はツライので Perl でやろうと思っています。
RTF::Parserというのを見つけてインストールはうまくいったんですが、
ドキュメントがまったくなく、お手上げです。
(TODO: Write a document とか書いてあるのがだいぶ前なので
    投げたのかも、、)
どなたか使い方をご存知の方リンクだけでもご存知の方教えてくださいませんか?

あと、他に Perl で RTF をパースした経験がある方
「やめたほうがいい」という結論に達した方などなど、
この問題に情報がある方はお寄せください。
また、RTF の規格についてわかりやすく書いているリンクなども、、。

あと、あまりにもこの件が掲示板の趣旨を逸脱するようでしたら
すみません、ツッコんでください。(^^;

スナフキンさん>
Cygwin 最高ですよね! 割り切って使うには最高です。
これと Meadow のおかげでやっと Windows と友達になれました。
ところで、1.1 をお使いですよね?
なぜか B20 ベースの解説サイトやソフトが多いのですが、
B20 にくらべて 1.1 は超超超超安定してていい感じです。
わたしはここでお世話になった技術で Apache をコンパイルして
CGI のテストも Windows でしてます!(^o^)

赤色の文字は 「Windows 機種依存文字」か、いわゆる「半角カナ」です。 この掲示板では自動変換されますが、今後は使用しないで下さい

No. 2106 # ten 2001/08/20 (月) 18:16:34
Solaris 2.6 で、Sun Workshop 4.2 を使用しています。
事情により境界整列を全く行なわせない指定をしたいので、

$ cc -flags
(snip)
>-misalign 境界整列していないデータのロード/ストアを可能にするコードを生成

を指定しているのですが、意図した様な動作が得られません。
また、
>#program align foo, var
と指定してもダメです。

どうすれば良いのか御存知の方、いらっしゃいますか?

No. 2107 # 68user 2001/08/21 (火) 10:13:44
>>2106 ten
>#program align foo, var
とりあえず program じゃなくて pragma でしょう。あと、試して
ませんが書き方が怪しいのではないかと思います。こちらを参考に。
    http://docs.sun.com/htmlcoll/coll.674.1/euc-jp/CUG/accOptions.html#1407

>>2105 ふくし
> また、RTF の規格についてわかりやすく書いているリンクなども、、。
Rich Text Format は Microsoft が作った規格なので、Microsoft に
仕様書が存在するはずなのですが、見付けられませんでした。もしかしたら
今は別の団体が管理しているのかもしれません。

No. 2108 # CCIE [E-mail] 2001/08/24 (金) 14:53:30
こんちは、お初です。最近Perlはじめました。
ほかの言語はからっきし使えません(TT関西弁ならいけるけど。。。
で、Perlのプログラミングで質問させてもらいます。
テキストファイルで、↓こういうかんじ

        name  age  year
--------------------------
    CCIE   22   2001

みたいな感じのテキストがあって、そこから3行目だけを出力させたいのと
この場合だと22だけを取り出したいっていう2つのことがどうすれば
いいか今格闘中です。
たぶん正規表現かなーっとおもって
オライリーの正規表現見てますがさっぱりで・・・(^^;)
どなたか助言よろしくお願いしますm(__)m

No. 2109 # 68user 2001/08/24 (金) 20:43:26
>>2108 CCIE
> 3行目だけを出力させたい
自分で何行読んだかを数えます。
    $line = 1;
    open(IN, "file");
    while (<IN>){
        if ( $line == 3 ){
            print "これが 3行目の内容です: $_";
        }
        $line++;
    }

> 22だけを取り出したい
$_ に "CCIE 22 2001\n" が入っている状態で、
    ($name, $age, $year) = split(/\s+/, $_);
とすれば $age に '22' が入ります。

\s は空白・タブを表し、\s+ は1文字以上連続した空白・タブを表しますので、
      $_ を1文字以上連続した空白・タブで分割し、それぞれのフィールドを
      $name、$age、$year に代入
という意味になります。

あるいは
    ($name, $age, $year) =~ m/^(.*)\s+(\d+)\s+(\d+)$/;
という方法もあります。^ は行頭、\d は数字、$ は行末を表し、
括弧でくくった部分がそれぞれ $name、$age、$year に代入されます。

No. 2110 # /tk 2001/08/25 (土) 01:04:46
>>2109 68user
> ($name, $age, $year) =~ m/^(.*)\s+(\d+)\s+(\d+)$/;
余計なような足りないような…

      ($name, $age, $year) = m/^(.*)\s+(\d+)\s+(\d+)$/;
若しくは
      ($name, $age, $year) = $_ =~ m/^(.*)\s+(\d+)\s+(\d+)$/;
では無いでしょうか?

No. 2111 # CCIE 2001/08/25 (土) 01:27:38
早々の返事ありがとうございますm(__)m
参考に勉強させてもらいます.
みなさんすごいですね.ってこういうのでつまづいているのは僕だけかな(TT
いまから,↓の$や()や\や+がごちゃごちゃしたものをゆっくり理解していきたいとおもいます.
実は今,これでいうと22の部分をTkのGIFgraphで表現しようと思ってるんです.
テキストファイルが定期的に書きかえられるのでグラフ化したいと思って.
それで,いま撃沈しているところを聞かせていただいたんです.
出きるだけ御迷惑をかけないように自分で努力したいと思いますが,また質問してしまうと思うのでそのときはよろしくお願いします.

No. 2112 # moz 2001/08/27 (月) 15:29:32
はじめまして。68userさんのページはとても勉強になります。時間があったら、全文を熟読したいと思います。(そんな時間ないかもしれませんが。)
それにしても、毎回いろいろな人からの質問に応えることのできる知識に、
少し圧倒されました。自分はまだまだ未熟者です。今後どーしてもわからないことがあったら、質問するかもしれませんので、そのときは、どうかよろしくお願いします。

No. 2113 # スナフキン 2001/08/28 (火) 03:14:24
ふと思ったのですが、CGIへPOSTメソッドでデータを送信した時に
そのCGIでデータを受け無い時(readしない場合)って、そのデータは
どうなるのでしょう?

CGIで、最近流行りのバッファーオーバーフロー対策?として、POST
データサイズを予め調べてから、read で読み込むようにしようと
考えましたが、このような場合は、サーバーOS/ソフト側でバッファ
に一旦溜まるのでしょうか?
それとも、CGIが受け取らない限りOS/ソフト側でデータそのものを
受け取らないのでしょうか?

試しに自環境にあるApacheに、アップロード機能付きの掲示板CGIを
使って約80Mbを送信してみましたが、cgi-lib.pl のエラー?でCGIは
停止したらしく、ps コマンドを見ると、zonbi となっていたため、
httpdがタイムアウト処理?をして切断された結果(だと思う)、ブラウザに
「cgi-lib.pl: Request to receive toomuch data: 84400432 bytes」と
表示され切断されたように見えました。
そして、その状態まで送信は止まらずにブラウザは送信を続けていました。

top や free で送信中のメモリの状態を観察していても変化がなかった
事から、CGIが受け取らないと捨てられてしまうようにも見えますが、
ちゃんと試験が出来ていたのか、自信が無いので正確な所は不明です。

結局、CGIでPOSTデータを受け取らなくても(プロセスが死んでいた為)
ブラウザ自身は送信を続けていたので、どの時点で(OSかApache)データ
を破棄しているのかは判断できませんでした。

そもそもCGI側でオーバーフローを気にしなくても良いならば、それでいい
のですが、どうも動作が判りません。
#それとも実装依存なのかな?

No. 2114 # 68user 2001/08/28 (火) 06:58:35
>>2110 /tk
> 余計なような足りないような…
確かに。補足どうもです。

>>2112 moz
> 質問するかもしれませんので、そのときは、どうか
> よろしくお願いします。
ぜひ回答する側にもまわって下さい :-)

>>2113 スナフキン
> そのCGIでデータを受け無い時(readしない場合)って、そのデータは
> どうなるのでしょう?
実装依存です。TCP 的に言えば、相手側がプロセスが read してくれないと相
手側の OS のバッファにたまります。それがいっぱいになったら書き込み側が
ブロックします。つまり
    print SOCKET "....";
を実行したままずっと止まってしまうということです。

ちゃんと調べたわけではありませんが、一般的にPOST データを全部受け取っ
て CGI に渡す web サーバが 多いような印象を受けます。あくまで印象なの
で、試したわけではありません。

もし
    int sock;
    bind(...);
    listen(...);
    sock = accept(...);
    ... ヘッダ読み込み ...

    if ( fork() == 0 ){
        char *args[]={"/home/user/public_html/cgi-bin/foo.cgi", NULL};
        dup2(sock, 0);
        execvp("cgi", args);
    } else {
        int status;
        wait(&status);
    }
のように、直接ソケットを CGI プロセスの標準入力に渡すような
実装ならば、CGI プロセスが read しないと書き込み側がブロック
するわけですね。

apache の実装がどうなっているかわかったら僕にも教えて下さい。

No. 2115 # 68user 2001/08/28 (火) 07:19:15
>>2114 68user
なんかいろいろとアレなので、書き直し。
    int sock;
    int pipes[2];

    bind(...);
    listen(...);
    sock = accept(...);
    ... ヘッダ読み込み ...

    pipe(pipes);

    if ( fork() == 0 ){
            char *args[]={"cgi", NULL};
            dup2(sock, 0);
            dup2(pipes[1], 1);
            execvp("/home/user/public_html/cgi-bin/foo.cgi", args);
    } else {
            char buf[256];
            int len;
            int status;
            while ( len=read(pipes[0], buf, sizeof(buf) ){
                  write(sock, buf, len);
            }
            wait(&status);
    }
ソケットのデータを CGI プロセスの標準入力に渡し、
CGI プロセスの標準出力を受け取り、そのままブラウザに
返す web サーバもどきです。

Prev< No. 2105〜2115> Next  [最新発言に戻る] [過去ログ一覧]