Unicode

読み方 : ゆにこーど

Unicodeとは

英数字、ひらがな、カタカナ、漢字、ハングルなど世界中のすべての文字を扱うことを目指した文字コード体系。1991年に米国コンピュータメーカーが中心になって結成したUnicodeコンソーシアムが策定している。

ISO(国際標準化機構)とIEC(国際電気標準会議)はUnicodeをベースにした文字コード規格ISO/IEC10646-1:1993を定めており、それを受けてJIS(日本工業規格)ではJIS X0221-1995として制定している。

WindowsやJavaの内部文字コード、XML(Extensible Markup Language)ではすでにUnicodeが使われている。Internet ExplorerなどのWebブラウザもUnicodeをサポートする。

Unicodeは基本的にすべての文字を2バイト(16ビット)で表現する。日本語文字はひらがな、カタカナ、JIS第1第2水準漢字(約6400字)、JIS補助漢字(約5800字)を含んでいる。ただし漢字は種類が多いため、日本、中国、韓国などで使われる漢字のうち形が似たものは、同じ文字として一つの文字コードに割り当てている(ユニフィケーションと呼ぶ)。ユニフィケーションに対して、国内では批判的な意見が多い。様々な文字の追加要求があることから、16ビットに加えて32ビットで文字を表現する仕組みも備えている。

出典:ITpro「今日のキーワード」(C)日経BP社

[2010年 1月 1日 公開]

お役立ち情報満載!「資料ダウンロードまとめサイト」のご案内