同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c3a4c385546ec3a4c385546e4d | äà Tnäà TnM |
SJIS-WIN | c3a4c385546ec3a4c385546e4d | テ、テ?nテ、テ?nM |
EUC-JP | c3a4c385546ec3a4c385546e4d | 辰?Tn辰?TnM |
UTF-8 | c3a4c385546ec3a4c385546e4d | äÅTnäÅTnM |
UHC | c3a4c385546ec3a4c385546e4d | 채횇Tn채횇TnM |