同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | 111001101001110110111110111011111010100010010100111011101000001010101011 | æ¾ï¨î« |
SJIS-WIN | 111001101001110110111110111011111010100010010100111011101000001010101011 | 譚セ?誹き |
EUC-JP | 111001101001110110111110111011111010100010010100111011101000001010101011 | ?常?? |
UTF-8 | 111001101001110110111110111011111010100010010100111011101000001010101011 | 松﨔 |
UHC | 111001101001110110111110111011111010100010010100111011101000001010101011 | 呂억쮷壯 |