同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c0e1a2ab3fc0e43fc0e1a2ab3fc0e4 | À᢫?Àä?À᢫?Àä |
SJIS-WIN | c0e1a2ab3fc0e43fc0e1a2ab3fc0e4 | タ發ォ?タ?タ發ォ?タ |
EUC-JP | c0e1a2ab3fc0e43fc0e1a2ab3fc0e4 | 節←?絶?節←?絶 |
UTF-8 | c0e1a2ab3fc0e43fc0e1a2ab3fc0e4 | ????????? |
UHC | c0e1a2ab3fc0e43fc0e1a2ab3fc0e4 | 잠˙?잤?잠˙?잤 |