|
以下の様なカンマ区切りのファイルがあります。 001,a2,a3,a4,a5,a6,a7,a8,a9,a10,,,,,, 002,a2,a3,a4,a5,a6,a7,a8,a9,a10,111:222,123:456,001:002,100:200,A01:A02,0:1 003,a2,a3,a4,a5,a6,a7,a8,a9,a10,111:222,123:,:,:,A01:A02,: フィールドの11カラム以降からは、コロン区切りで複数設定されている場合がある ので、複数行に分けたいのです。 以下の様に、 001,a2,a3,a4,a5,a6,a7,a8,a9,a10,,,,,, 002,a2,a3,a4,a5,a6,a7,a8,a9,a10,111,123,001,100,A01,0 002,a2,a3,a4,a5,a6,a7,a8,a9,a10,222,456,002,200,A02,1 003,a2,a3,a4,a5,a6,a7,a8,a9,a10,111,123,,,A01, 003,a2,a3,a4,a5,a6,a7,a8,a9,a10,222,,,,A02, に編集し、ファイルに出力したいのですが、11カラム以降の処理が上手く行きません。 3通りほど、試してみたのですが、それぞれ駄目でした。 どこがいけないのかとどうすればよいのかを教えてください。 環境は、 Solaris8、Bシェル です。 No.1 ----------------------------------------------------------------- #!/bin/sh # if [ $# -eq 0 ] ; then echo "$0 FileName" exit 1 fi FILE=$1 OUT_FILE=kekka.log rm ${OUT_FILE} > /dev/null 2>&1 nawk -v OUT=${OUT_FILE} ' function max_desc(lstadr,lst) { m=split(lstadr,lst,":") ; return m ; } { cnt=1 ; n=split($0,arglst,",") ; for(i=11;i<=n;i++) { m=max_desc(arglst[i],lst["${i}"]) ; if (m>cnt) { cnt=m ; } } no=1 ; for(i=1; i<=cnt; i++) { for(j=1; j<=n; j++) { if (j==2) { printf("%d,",no++) >> OUT ; } else if (j==11 || j==12 || j==13 || j==14 || j==15 || j==16) { printf("%s,",lst["${j}"][i]) >> OUT ; } else { printf("%s,",arglst[j]) >> OUT ; } } printf("\n") >> OUT ; } }' ${FILE} exit 0 No.2 ----------------------------------------------------------------- #!/bin/sh # if [ $# -eq 0 ] ; then echo "$0 FileName" exit 1 fi FILE=$1 OUT_FILE=kekka.log rm ${OUT_FILE} > /dev/null 2>&1 nawk -v OUT=${OUT_FILE} ' function max_desc(lstadr,lst) { cnt=split(lstadr,lst,":") ; return cnt ; } { num=1 ; n=split($0,arglst,",") ; for(i=11;i<=n;i++) { ret=max_desc(arglst[i],lst[++x,y]) ; if (ret>num) { num=ret ; } } nf=x ; no=1 ; for(y=1; y<=num; y++) { for(j=1; j<=10; j++) { if (j==2) { printf("%d,",no++) >> OUT ; } else { printf("%s,",arglst[j]) >> OUT ; } } for(x=1; x<=nf; x++) { printf("%s,",lst[x,y]) >> OUT ; } printf("\n") >> OUT ; } }' ${FILE} exit 0 No.3 ----------------------------------------------------------------- #!/bin/sh # if [ $# -eq 0 ] ; then echo "$0 FileName" exit 1 fi FILE=$1 OUT_FILE=kekka.log rm ${OUT_FILE} > /dev/null 2>&1 nawk -v OUT=${OUT_FILE} ' function max_desc(lstadr,lst,x) { cnt=split(lstadr,arrlst,":") ; for(j=1;j<=cnt;j++) { lst[x,j]=arrlst[j] ; } return cnt ; } { num=1 ; n=split($0,arglst,",") ; for(i=11;i<=n;i++) { ret=max_desc(arglst[i],lst[++x,y],x) ; if (ret>num) { num=ret ; } } nf=x ; no=1 ; for(y=1; y<=num; y++) { for(j=1; j<=10; j++) { if (j==2) { printf("%d,",no++) >> OUT ; } else { printf("%s,",arglst[j]) >> OUT ; } } for(x=1; x<=nf; x++) { printf("%s,",lst[x,y]) >> OUT ; } printf("\n") >> OUT ; } }' ${FILE} exit 0 |
|
>>4579 べた これが賢いやり方とも思えませんが、一応作ってみました。 ------ $ cat a.awk BEGIN { FS=","; chk_col=11; } { if ($chk_col ~ /:/) { str_head=head_string(); split_num=split($chk_col, str_foot, ":"); for (i=1; i<=split_num; i++) { for (j=chk_col+1; j<=NF; j++) { split($j, col_buf, ":"); str_foot[i]=sprintf("%s,%s", str_foot[i], col_buf[i]); } print str_head "," str_foot[i]; } } else { print; } } function head_string() { str_buf=$1; for (k=2; k<chk_col; k++) { str_buf=sprintf("%s,%s", str_buf, $k); } return str_buf; } ------ ------ $ cat a 001,a2,a3,a4,a5,a6,a7,a8,a9,a10,,,,,, 002,a2,a3,a4,a5,a6,a7,a8,a9,a10,111:222,123:456,001:002,100:200,A01:A02,0:1 003,a2,a3,a4,a5,a6,a7,a8,a9,a10,111:222,123:,:,:,A01:A02,: ------ ------ $ awk -f a.awk a 001,a2,a3,a4,a5,a6,a7,a8,a9,a10,,,,,, 002,a2,a3,a4,a5,a6,a7,a8,a9,a10,111,123,001,100,A01,0 002,a2,a3,a4,a5,a6,a7,a8,a9,a10,222,456,002,200,A02,1 003,a2,a3,a4,a5,a6,a7,a8,a9,a10,111,123,,,A01, 003,a2,a3,a4,a5,a6,a7,a8,a9,a10,222,,,,A02, ------ >>4571 68user 今更ですが、Solarisでは $ echo "Apr 02 12:25:00 ===" | sort -M - logfile | \ sort -n -k2,3 | cat -n | grep "===" | awk '{print $1}' 等としないとダメみたいです。 |
|
>>4580 zsh zshさん、ありがとうございます。 一応、動いたのですが、フィールド2の値を別の 文字置き換えたいのですが、どうすればよいのですか。 ファイル11以降に「:」で区切られたデータが存在した 場合、データの数分順番に番号を振りたいのです。 なければ、デフォルトで”1”としたいのです。 ----- $ cat a 001,a2,a3,a4,a5,a6,a7,a8,a9,a10,,,,,, 002,a2,a3,a4,a5,a6,a7,a8,a9,a10,111:222,123:456,001:002,100:200,A01:A02,0:1 003,a2,a3,a4,a5,a6,a7,a8,a9,a10,111:222,123:,:,:,A01:A02,: ----- 結果 001,1,a3,a4,a5,a6,a7,a8,a9,a10,,,,,, 002,1,a3,a4,a5,a6,a7,a8,a9,a10,111,123,001,100,A01,0 002,2,a3,a4,a5,a6,a7,a8,a9,a10,222,456,002,200,A02,1 003,1,a3,a4,a5,a6,a7,a8,a9,a10,111,123,,,A01, 003,2,a3,a4,a5,a6,a7,a8,a9,a10,222,,,,A02, |
|
>>4581 べた 適当に直してみました。 ------ BEGIN{ FS=","; chk_col=11; } { str_head_1=$1; if($chk_col ~ /:/) { str_head_2=head_string(chk_col); split_num=split($chk_col, str_foot, ":"); for (i=1; i<=split_num; i++) { for (j=chk_col+1; j<=NF; j++) { split($j, col_buf, ":"); str_foot[i]=sprintf("%s,%s", str_foot[i], col_buf[i]); } print str_head_1 "," i "," str_head_2 "," str_foot[i]; } } else { str_head_2=head_string(NF); print str_head_1 ",1," str_head_2; } } function head_string(chk_point) { str_buf=$3; for (k=3; k<chk_point; k++) { str_buf=sprintf("%s,%s", str_buf, $k); } return str_buf; } ------ |
|
>>4582 zsh zshさん、ありがとうございます。 >str_head_2=head_string(NF+1); >for (k=4; k<chk_point; k++) { の行を修正したら期待する結果が得られました。 ただ、ファイルのフォーマットに規則性がないことがわかり、 データによっては、正しく出力されないものがでてきました。 フィールド11に、「:」が存在しないデータがあるのです。 a1,a2,a3,a4,a5,a6,a7,a8,a9,a10,111,123,SSS,A01,,: a1,a2,a3,a4,a5,a6,a7,a8,a9,a10,,,,123:456:789:100:100,A01:A02:A03:3A:NTT0001, 「 if($chk_col ~ /:/) {」 の判定を増やし、フィールド番号を取得できればできますか。 |
|
>>4582 zsh >>4583 べた 一応、動きます。 以下のようになるのでしょうか。 BEGIN{ FS=","; chk_col=11; } { str_head_1=$1; split_num=chk_comma_max(NF); if(split_num!=0) { str_head_2=head_string(chk_col); split($chk_col, str_foot, ":"); for (i=1; i<=split_num; i++) { for (j=chk_col+1; j<=NF; j++) { split($j, col_buf, ":"); str_foot[i]=sprintf("%s,%s", str_foot[i], col_buf[i]); } print str_head_1 "," i "," str_head_2 "," str_foot[i]; } } else { str_head_2=head_string(NF+1); print str_head_1 ",1," str_head_2; } } function chk_comma_max(chk_point) { comma_num=0; for (k=chk_col; k<=chk_point; k++) { if($k ~ /:/) { comma_num=split($k, s, ":"); break; } } return comma_num; } function head_string(chk_point) { str_buf=$3; for (k=4; k<chk_point; k++) { str_buf=sprintf("%s,%s", str_buf, $k); } return str_buf; } |
|
>>4579 べた No.1 m=max_desc(arglst[i],lst["${i}"]) ; 添え字を利用した配列でいいのかな。 あまり利用したことはないのでなんとも入れないが、こういうところで 使えないのではないでしょうか。 添え字にマッチする文字が出てきたときに、何かするのではなかった かと思います。 No.2、No.3 多次元配列の使い方がおかしいのではないかと思います。 データをセットする側が多次元配列や、アドレス渡しの戻りができて いない。たぶん、縦軸(列)の添え字の値が正しくない。 縦軸(列)の値ってちゃんととれてますか。 |
|
>>4579 べた 多次元配列の使い方が正しいか問題はありますが、書き込みがあった シェルを使用して、多次元配列で動くのを作ってみました。 一応、動きますが。 ----------------------- #!/bin/sh # if [ $# -eq 0 ]; then echo "$0 FileName" exit 1 fi FILE=$1 OUT_FILE=kekka.log rm ${OUT_FILE} > /dev/null 2>&1 nawk -v OUT=${OUT_FILE} ' function max_desc(lstadr,lst,x,y) { cnt=split(lstadr,arrlst,":"); for(y=1;y<=cnt;y++) { lst[x,y]=arrlst[y]; } return cnt; } { num=1; row=0; col=0; n=split($0,arglst,","); for(i=11;i<=n;i++) { ret=max_desc(arglst[i],lst,++row,col); if (ret>num) { num=ret; } } seqno=1; for(y=1; y<=num; y++) { for(j=1; j<=10; j++) { if (j==2) { printf("%d,",seqno++) >> OUT ; } else { printf("%s,",arglst[j]) >> OUT; } } for(x=1; x<=row; x++) { printf("%s",lst[x,y]) >> OUT; if (x!=row) { printf("%s",",") >> OUT; } } printf("\n") >> OUT; } for(x=1; x<=row; x++) { for(y=1; y<=num; y++) { delete lst[x,y]; } } }' ${FILE} exit 0 ----------------------- |
|
あるCシェルの本でファイル検査演算子「-f」の意味は 「ファイルは普通のファイル」とあるのですが、 普通の定義が分かりません。 また、逆に普通ではないファイルとはどういったもの になるのでしょうか?? ご回答頂ければ、幸いです。 宜しくお願い致します。 |