裏紙

450 : ◆lllllTqq9g :2006/12/13 22:34:24
いわゆる半角カナは機種依存文字じゃないよう。

もっと正確にいうならば、JIS X 0208 の附属書1で規定され、
IANA に Shift_JIS として登録された ISO/JIS 用語でいうところの符号化文字集合には
文字集合として JIS X 0201 と JIS X 0208 が含まれおり、
JIS X 0201 にはいわゆる半角カナの文字が含まれている。
そのため、Shift JIS としてはいわゆる半角カナは機種依存文字ではない。

メールなどでよく用いられる ISO-2022-JP という符号化方式の場合には
JIS X 0201 のうちラテン文字用図形文字集合のみが含まれ
片仮名用図形文字集合は含まれないため、いわゆる半角カナは表現することができない。
これを独自拡張していわゆる半角カナを含められるようにしたものの場合には
いわゆる半角カナは機種依存文字となり、この話が誤って広まってしまったのではないかと思われる。

また、Shift JIS におけるいわゆる半角カナの領域とEUC-JP における
2バイト文字の領域が一部重なっており、うまく自動判別できずに
文字化けしてしまう可能性があるという話とも混同されているようにも思える。

Shift JIS の独自拡張である CP932 に含まれる丸囲み数字や
ローマ数字、単位文字などは Shift JIS には含まれないため、
"Sift JIS" という場合にはこれらは機種依存文字となる。
ただし、これらの文字も ISO 10646 として規格化された UCS には
含まれているため、Shift JIS の HTML 文書中でも
① のように文字実体参照を用いれば ① のようにして
安全に書くことができる。
(>>416の文字もこの方法で書いてあったりする。)

あっちのサイトではこれらの面倒な問題を回避するために
文字符号化方式として UTF-8 を用いてページ全体を UCS で表現している。
この方法の副作用として、IE6でもギリシャ語・キリル言語の文字に
font-family で指定したフォントが使われるため、
現状ではMSPゴシックを前提とするAAには最善なのではないかと思っている。
(>>27-28、関連: >>236,299)