同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | 11011110101010011101110011100100110111001111000101101010 | Þ©ÜäÜñj |
SJIS-WIN | 11011110101010011101110011100100110111001111000101101010 | ゙ゥワ葆 |
EUC-JP | 11011110101010011101110011100100110111001111000101101010 | 洫樞橸j |
UTF-8 | 11011110101010011101110011100100110111001111000101101010 | ީ????j |
UHC | 11011110101010011101110011100100110111001111000101101010 | 鄙俸逢j |