同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c394c38ac2a4c3a7c2a5c2aac2b1 | Ãä祪± |
SJIS-WIN | c394c38ac2a4c3a7c2a5c2aac2b1 | テ氾環、テァツ・ツェツア |
EUC-JP | c394c38ac2a4c3a7c2a5c2aac2b1 | ??造巽促捉賊 |
UTF-8 | c394c38ac2a4c3a7c2a5c2aac2b1 | Ôʤ祪± |
UHC | c394c38ac2a4c3a7c2a5c2aac2b1 | 횚횎짚챌짜짧짹 |