同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c3a165c3a27ac3a165c3a27a4d | áeâzáeâzM |
SJIS-WIN | c3a165c3a27ac3a165c3a27a4d | テ。eテ「zテ。eテ「zM |
EUC-JP | c3a165c3a27ac3a165c3a27a4d | 叩e但z叩e但zM |
UTF-8 | c3a165c3a27ac3a165c3a27a4d | áeâzáeâzM |
UHC | c3a165c3a27ac3a165c3a27a4d | 찼e창z찼e창zM |