同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | 11110100101001011000111010110110100011111101111010110101100011101011100010111100 | ô¥¶Þµ¸¼ |
SJIS-WIN | 11110100101001011000111010110110100011111101111010110101100011101011100010111100 | 叱鉦オ失シ |
EUC-JP | 11110100101001011000111010110110100011111101111010110101100011101011100010111100 | 凜カ諶ク |
UTF-8 | 11110100101001011000111010110110100011111101111010110101100011101011100010111100 | ???????? |
UHC | 11110100101001011000111010110110100011111101111010110101100011101011100010111100 | 處렧뤰탮맑 |