68user's page 掲示板

Prev< No. 2677〜2682> Next  [最新発言に戻る] [過去ログ一覧]
No. 2677 # 68user 2002/05/08 (水) 01:27:53
>>2675 ふくし
> よく、インターネット(Web、メール)で(いわゆる)半角カナを
> 使ってはいけないといわれますが、
おっと、見逃してた。ここで「web」を挙げているのは誤りです。

インターネット (≒ TCP/IP) は 8bit を通します。FTP も HTTP も
8bit through です。過去 7bit しか通さない実装が多かったのは
SMTP で、7bit しか通らないところに日本語を通そうという苦肉の
策が、後の ISO-2022-JP につながる JUNET コードです。

よって、web で半角カナ使用禁止という話はありません。もちろん web で
    Content-type: text/html; charset=ISO-2022-JP
としているならば半角カナは使えませんけれども。

ちなみに、個人的には半角カナは嫌いでしたが、2ch で AA を見てると、まぁ
半角カナもいいかなと思い始めていました。が、半角カナは EUC-JP と
Shift_JIS でバイト長が違うため、項目長を事前に決めておかなければ
ならない DB では何かとトラブルの元です。よって、やっぱり半角カナ
嫌いに戻ってしまいました。

No. 2678 # ふくし [E-mail] 2002/05/08 (水) 01:29:20
そっかー。68user さんもわからないと聞いて
少なくともつまんない質問ではなかったとわかって
なんかホッとしました(^o^)
マルチポストになりますが、別所で聞き、なにかわかったら
また書きます。ありがとうございます。
他の方も、なにかありましたらご教示ください。

No. 2679 # へにか [URL] 2002/05/08 (水) 08:16:13
>>2675 ふくし
>>2676 68user
お久しぶりです。
http://euc.jp/i18n/charcode.ja.html
によると、
>終端文字と文字集合の対応は登録制になっており、 ECMAという組織が登録簿を管理して います。
(略)
>・94文字集合
(略)
>I
> JIS X 0201カタカナ
>J
> JIS X 0201ローマ文字
とあります。
先にECMAが決めたのか、誰かが既に決めたのをECMAが登録したのかは、
わかりませんが。

No. 2680 # 68user 2002/05/08 (水) 22:39:05
>>2679 へにか
なるほどなるほど。
    http://www.ecma.ch/ecma1/STAND/STANDARD.HTM
のどれかにその記述があるのでしょうか。PDF しかないようなので
中身は見ていませんけれども。

ちなみに G0 とかロッキングシフトなども理解してないんですが (どこの
解説を読んでもよくわからん)、初心者向けの解説がどこかにないもので
しょうか。

No. 2681 # ふくし [E-mail] 2002/05/09 (木) 02:51:01
へにかさん、ありがとうございます。
わたしも xyzzy ユーザーズMLで質問を投げました。
いまメーラーが使えないので、記憶でサマリーすると、

・ふくしが ISO-2022-JP の4つの面にそれぞれ半角カナ以外の
    コードが入っていると思っているのはカン違いで、
    ISO-2022-JP は G0 集合だけを使い、エスケープシーケンスで
    切り替えて使う(G1〜G3 は使用禁止)

・そこに割り当てられるコードが
(RFC 1468 より引用)
> Esc Seq Character Set ISOREG
> ESC ( B ASCII 6
> ESC ( J JIS X 0201-1976 ("Roman" set) 14
> ESC $ @ JIS X 0208-1978 42
> ESC $ B JIS X 0208-1983 87
    の4種類で、7ビットカナ(JIS X201 の右半分)は
    意図的にはずされている

・JIS X201 のコード表と、終端記号の I は、
    へにかさんも書いておられますが ISO の登録簿にある。
    http://www.itscj.ipsj.or.jp/ISO-IR/
    で登録されているものは確認できる。

・登録を行う=>終端記号が割り当ててもらえる、
    という流れで、登録作業は
    ISO/IEC JTC1/SC2 の事務国である日本(!)

ということだそうです。
ESC(I の歴史は ISO-2022-JP より古く、
ISO-2022 のフルセットを使えば半角カナが使えるように
(だと思うんですが、、)
定義されているようです。

他にもいくつか ISO-2022-JP の半角カナ拡張はありますが
(G1 集合に半角カナがあるとみなして、
    往年の ISO 646 のように SI/SO で切り替えたり。
    これは Microsoft Internet Mail 方式?)
・G0 のみしか使わない
・ISO の登録簿にあるコード表と終端文字を使う
という点で、最も正当で自然な方法と ESC(I 式が
みなされているそうです。

で、推奨される文献としては
http://euc.jp/i18n/charcode.ja.html#chap4
が上げられていました。
xyzzy の ML はアーカイヴが公開されているので、
教えてくださった方との実際のやりとりはそこで読めると思います。

いかがでしょうか。
こんなところでぼくは満足ですが、、。

で、2ch の AA ってなんですか?(^^)

No. 2682 # ぐっさん 2002/05/09 (木) 21:56:25
もう、だめ・・・
CPU使用率の確認でsar -vってのあるんだけど、そのなかの
file-szはシステムファイルテーブルの現在サイズ、および最大サイズ
ってとこまではわかってるんですけど、
システムファイルテーブルって何を管理してるテーブルなの?
だれかおしえて・・・
システムファイルだよっていうのは無しで。

Prev< No. 2677〜2682> Next  [最新発言に戻る] [過去ログ一覧]