同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | 101111001110010100111111001111110011111100111111001111111101111011010011 | ¼å?????ÞÓ |
SJIS-WIN | 101111001110010100111111001111110011111100111111001111111101111011010011 | シ?????゙モ |
EUC-JP | 101111001110010100111111001111110011111100111111001111111101111011010011 | 弱?????湲 |
UTF-8 | 101111001110010100111111001111110011111100111111001111111101111011010011 | ????????? |
UHC | 101111001110010100111111001111110011111100111111001111111101111011010011 | 쇔?????巳 |