同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | 11000011101101011100001110111011011011011100001110110101110000111011101101101101 | õûmõûm |
SJIS-WIN | 11000011101101011100001110111011011011011100001110110101110000111011101101101101 | テオテサmテオテサm |
EUC-JP | 11000011101101011100001110111011011011011100001110110101110000111011101101101101 | 探短m探短m |
UTF-8 | 11000011101101011100001110111011011011011100001110110101110000111011101101101101 | õûmõûm |
UHC | 11000011101101011100001110111011011011011100001110110101110000111011101101101101 | 천청m천청m |