同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | 10001110110000111000111010100100100011101100001110001110101111100100001101101001 | äþCi |
SJIS-WIN | 10001110110000111000111010100100100011101100001110001110101111100100001101101001 | 偲痔偲疾Ci |
EUC-JP | 10001110110000111000111010100100100011101100001110001110101111100100001101101001 | テ、テセCi |
UTF-8 | 10001110110000111000111010100100100011101100001110001110101111100100001101101001 | ?Î??Î?Ci |
UHC | 10001110110000111000111010100100100011101100001110001110101111100100001101101001 | 렻렎렻렱Ci |