同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c0e5c2a4b4e9c0e5c2a4b4e94d | À头éÀ头éM |
SJIS-WIN | c0e5c2a4b4e9c0e5c2a4b4e94d | タ蠶、エ鯊蠶、エ餉 |
EUC-JP | c0e5c2a4b4e9c0e5c2a4b4e94d | 舌造顔舌造顔M |
UTF-8 | c0e5c2a4b4e9c0e5c2a4b4e94d | ??¤????¤??M |
UHC | c0e5c2a4b4e9c0e5c2a4b4e94d | 장짚닻장짚닻M |