同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | 100011111100001011000100100011101101110011111011 | ÂÄÜû |
SJIS-WIN | 100011111100001011000100100011101101110011111011 | 渉ト灼 |
EUC-JP | 100011111100001011000100100011101101110011111011 | 晳ワ |
UTF-8 | 100011111100001011000100100011101101110011111011 | ??Ď?? |
UHC | 100011111100001011000100100011101101110011111011 | 뤒훿咐 |