第九回 Dr.ライデリのIT用語辞典
「Dr.ライデリのIT用語辞典」は急速に進むITと、それに伴う社会や規則性などの変化の中で生まれた新しい用語などから、毎回抜粋して解説しています。

今回のテーマは「文字コード」じゃ!
ブラウザなどの文字化けの原因になる。この問合せも多いんじゃ。 皆よーく勉強しておくれ。


文字コード
「character code」

日本語文字はワープロやパソコンの中では基本的に4桁の数字で表されとるのじゃが、これが『文字コード』じゃ。パソコンがまだ普及していない頃、ワープロ専用機で、難しい旧字を分厚い漢字コード表を見て出した経験がある方も多いかもしれんな。

データの相違による、文字化けが生じないよう、『文字コード』は言語ごとにある程度、統一されておる。日本語の場合は、日本工業規格が定めたJISコード。これを継承・発展させた『シフトJISコード』が広く使用されている。

世界中の言語の文字コードにもいろいろな種類があり、かつOSの違いもあるので、コンピューターやインターネットの世界では『文字化け』という現象は今のところ避けられない厄介な問題なのじゃ。原因のひとつとして、機種依存文字の使用。例えば、矢印や丸で囲んだ文字、などは、標準のコードがないため、化けやすい。それとフォントもかなりな曲者じゃ。相手先にないフォントなど使うと、正しい表示にならんのじゃ。

インターネットを閲覧するためのブラウザソフトでの回避策は、ウインドウのメニューバーにある「表示」をクリックし、「エンコード」をクリックすると、「日本語(自動選択)」「日本語(シフトJIS)」「日本語(EUC)」「西ヨーロッパ言語」「アラビア語」などという表示になり、どの文字コードで表示するかを選べる。一般的には「日本語(自動選択)」としておけば大丈夫じゃ。

関連用語
イーユーシー
EUC
日本語では他に、EUC(Extended Unix Code)というUNIX用の文字コードもあるが、 パソコンとはあまり縁がなくサーバーによく使われておる。一般的なブラウザソフトは、EUCコードも読めるようになっておる。
ユニコード
Unicode
ユニコードと呼ばれる世界共通の文字コードも開発されておる。世界の文字をすべて2バイト文字に統一したものじゃが、ソフトウェアなども、これに対応させておけば、わざわざ修正する必要がない。英語のOSの上で日本語ソフトを動かすことも可能なのじゃが、細かい点でいろいろ改善が必要で、まだ実用には無理がある。将来に期待しよう