研究:世界の言葉を表現する文字コード世界は奥が深い

文字コードの歴史は、既存の文字資産を活かしながら各国の文化を順次取り入れたため複雑な体系となっており、奥の深さに驚きます。
書籍を購入して研究し、多言語の翻訳に活かしています。


文字コードの歴史(概略)

ASCII (1バイト 米国)

ISO/IEC 646(1バイト 各国) JIS X 0201(日本)

ISO/IEC 8859 (1バイト拡張 欧州)

ISO/IEC 2022 (2バイト 各国)
↓ JIS X 0208, Shift_JIS(日本), GB2312(中国), KS X 1001(韓国)
↓ Big 5(台湾)*ISO/IEC 2022に非準拠
ISO/IEC10646(Unicode) (2バイト~4バイト_全言語目標) UTF-8, UTF-16



参考文献:技術評論社 「文字コード技術入門」



特許・技術翻訳
多言語
翻訳メモリ
高品質を支える背景
ISOのマーク
プライバシーマーク