同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c3a4c3abc284c3acc287c2b0 | äëÂì° |
SJIS-WIN | c3a4c3abc284c3acc287c2b0 | テ、テォツ?ャツ?ー |
EUC-JP | c3a4c3abc284c3acc287c2b0 | 辰谷?狸?属 |
UTF-8 | c3a4c3abc284c3acc287c2b0 | äëì° |
UHC | c3a4c3abc284c3acc287c2b0 | 채챘혙챙혝째 |