同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c3a453c28ac28ac28b43c3a5c3bc | äSÂÂÂCåü |
SJIS-WIN | c3a453c28ac28ac28b43c3a5c3bc | テ、Sツ環環気テ・テシ |
EUC-JP | c3a453c28ac28ac28b43c3a5c3bc | 辰S???C奪端 |
UTF-8 | c3a453c28ac28ac28b43c3a5c3bc | äSCåü |
UHC | c3a453c28ac28ac28b43c3a5c3bc | 채S혡혡혢C책체 |