同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | 11101101110110110011111111011110110101110011111111110110110000001111011011000000 | íÛ?Þ×?öÀöÀ |
SJIS-WIN | 11101101110110110011111111011110110101110011111111110110110000001111011011000000 | 沆?゙ラ? |
EUC-JP | 11101101110110110011111111011110110101110011111111110110110000001111011011000000 | 轉?湫??? |
UTF-8 | 11101101110110110011111111011110110101110011111111110110110000001111011011000000 | ?????????? |
UHC | 11101101110110110011111111011110110101110011111111110110110000001111011011000000 | 丈?捨?痔痔 |