同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c3a2c2abc28bc28fc28f42c3a2c3ab | â«ÂÂÂBâë |
SJIS-WIN | c3a2c2abc28bc28fc28f42c3a2c3ab | テ「ツォツ仰渉州テ「テォ |
EUC-JP | c3a2c2abc28bc28fc28f42c3a2c3ab | 但束???B但谷 |
UTF-8 | c3a2c2abc28bc28fc28f42c3a2c3ab | â«Bâë |
UHC | c3a2c2abc28bc28fc28f42c3a2c3ab | 창짬혢혧혧B창챘 |