68user's page 掲示板

Prev< No. 673〜676> Next  [最新発言に戻る] [過去ログ一覧]
No. 673 # mm 2000/01/19 (水) 22:35
>の「1バイト目がF9」という記述が間違っているのかな?
文字コード表くらい、どこかにあるだろうと思って、検索したけど、意外とないですね。
ウチの漢字コード表では、間違いなく115区はFAになってます。

http://www.vector.co.jp/soft/win95/util/se102214.html
>IBM拡張文字区点コード(換算)で115区〜119区(FA40-FC4B)
という記述もありました。

やはり、
http://www2d.biglobe.ne.jp/~msyk/charcode/kisyuizon/115-116ku.html
http://www2d.biglobe.ne.jp/~msyk/charcode/kisyuizon/117-118ku.html
は、1ずつずれてるんじゃないかなぁ…
http://www2d.biglobe.ne.jp/~msyk/charcode/kisyuizon/119-120ku.html
のFCはOKかな

>Windows を動かすと PC/AT 機と同じなんでしょうかね。
うーん、よく分かりません(苦笑)

No. 674 # goosan [E-mail] 2000/01/19 (水) 23:19
0xFA40という文字ですが、私の環境(PC/AT+Win95)では、
この掲示板上では i とは表示されず、0xEDBEと同じ文字として表示されます。
同様に viii も0xEDC5と同じになっています。
この掲示板の漢字コードはEUCのようですが、EUCの2バイト漢字の範囲は
JIS-X0208と同じで、これはシフトJISで0xEFFCまでに対応しているので、
それ以降のシフトJISコードはEUCに変換できません。
するとこの場合は、0xFA40というコードがEUCに変換されずに素通りして
しまい、その第1,2バイト目のそれぞれのトップビットを取った
0x7A40がたまたまシフトJISの0xEDBEに一致していたためと思われます。

No. 675 # mm 2000/01/20 (木) 01:08
>0x7A40がたまたまシフトJISの0xEDBEに一致していたためと思われます。
ちゃんと理解してませんが、Shift-JISの0xEDBE(日偏に春の文字)は、EUCのソース上では、
0xFAC0になってますね。
これは、0xFA40が変換されずに、第2バイトのMSBが立っただけってことかな?

No. 676 # 68user [URL] [E-mail] 2000/01/20 (木) 01:09
いえ、違うと思います>goosan

この掲示板では、入力文字列を jcode::convert を使って EUC に
変換し、EUC コードで機種依存文字のチェックをしています。

で、jcode::convert は、SJIS の 0xFA40 (i) を 0xFAC0 に
変換するようですが、これは多分間違った結果ではないかと思います。
# EUC の扱える JIS X 0208 は 94区までしか定義されていないので、
# 間違っているという表現は不適切かもしれませんが。

で、EUC の 0xFAC0 は
    http://www2d.biglobe.ne.jp/~msyk/charcode/kisyuizon/89-90ku.html
の `日春' という文字に相当するので、その文字が表示されている、
ってことだと思います。

で、mm さんはそれをコピーして
    http://X68000.startshop.co.jp/~68user/cgi-bin/wwwboard.cgi?log=666
に書かれたので、`日春'`が自動変換され、「〓」となってしまった
ということではないでしょうか。


さて、困ったなぁ。SJIS で 95区以降 (JIS X 0208 で
規定されていない部分) の入力があった場合どうするべきか。
…と悩んで調べてみたところ、
    http://www.opengroup.or.jp/jvc/cde/sjis-euc.html
> 注記:
> ...
> 3.NEC選定IBM拡張文字は,SJISから日本語EUCへの変換においては,
>  SJISでいったん IBM拡張文字に 変換してから日本語EUCに変換する.
    http://www.opengroup.or.jp/jvc/cde/ibmext-table.html
のように、補助漢字 (JIS X 0212) に置換するのも一つの解な
ようですね。ただ、少なくとも FreeBSD (X Window System) では
JIS X 0212 フォントはオプショナルですし、Windows ではまず
JIS X 0212 は使えないでしょうし (SJIS では JIS X 0212 は
使用できない)、現実的ではないかもしれません。

結局 jcode.pl を修正し、さらにブラウザが Windows なら
SJIS で出力、UNIX なら EUC で出力、ってことになるのかなぁ。
# …なんかどんどん深みにはまっていってるような気が (笑)

ところで、仮に mm さんが 91/92 区の i/viii を使っていたら
自動変換されたはずなのですが、mm さんがお使いの IME は
普通に i/viii を入力すると 115/116区のコードになって
しまうんでしょうか?

Prev< No. 673〜676> Next  [最新発言に戻る] [過去ログ一覧]