文字コード | 解説 |
---|---|
UTF-8 |
UTF-8(ユーティーエフはち、ユーティーエフエイト)はISO/IEC 10646(UCS)とUnicodeで使える8ビット符号単位の文字符号化形式及び文字符号化スキーム。 正式名称 「ISO/IEC 10646」=「UCS Transformation Format 8」 「Unicode」=「Unicode Transformation Format-8」 両者はISO/IEC 10646とUnicodeのコード重複範囲で互換性があり。 RFCにも仕様がある。 「データ交換方式」「ファイル形式」では、一般的にUTF-8が使われる傾向。 Linuxでは、OSの標準文字エンコードとして使用されてもいる。 |
UTF-16 | |
UTF-32 | |
ISO-2022-JP |
ISO-2022-JPは、インターネット上(特に電子メール)などで使われる日本の文字用の文字符号化方式。 「JISコード」とも呼ばれる。 |
EUC-JP |
EUC-JP(Extended UNIX Code Packed Format for Japanese、日本語EUC)は、UNIX上で日本語の文字を扱う場合にもっとも多く利用されている文字コード(符号化方式)のひとつ。 UNIX以外のOS上で使われることもある。 |