株式会社国土ブレーンワーク

研究：世界の言葉を表現する文字コード世界は奥が深い

文字コードの歴史は、既存の文字資産を活かしながら各国の文化を順次取り入れたため複雑な体系となっており、奥の深さに驚きます。
書籍を購入して研究し、多言語の翻訳に活かしています。

文字コードの歴史(概略)

ASCII (1バイト米国)
↓
ISO/IEC 646（1バイト各国） JIS X 0201(日本)
↓
ISO/IEC 8859 (1バイト拡張欧州)
↓
ISO/IEC 2022 (2バイト各国)
↓ JIS X 0208, Shift_JIS(日本), GB2312(中国), KS X 1001(韓国)
↓ Big 5（台湾)＊ISO/IEC 2022に非準拠
ISO/IEC10646(Unicode) (2バイト～4バイト_全言語目標) UTF-8, UTF-16

参考文献：技術評論社　「文字コード技術入門」