同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c3a9c3a1c2aac3a5c3a8c3a2c3bcc39a | éáªåèâüà |
SJIS-WIN | c3a9c3a1c2aac3a5c3a8c3a2c3bcc39a | テゥテ。ツェテ・ティテ「テシテ |
EUC-JP | c3a9c3a1c2aac3a5c3a8c3a2c3bcc39a | 辿叩捉奪竪但端? |
UTF-8 | c3a9c3a1c2aac3a5c3a8c3a2c3bcc39a | éáªåèâüÚ |
UHC | c3a9c3a1c2aac3a5c3a8c3a2c3bcc39a | 챕찼짧책챔창체횣 |