同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c3a4c3abc2a0c3acc2a4c2aac3a4c3abc2a0c3acc2a4c2aa4d | äë ì¤ªäë ì¤ªM |
SJIS-WIN | c3a4c3abc2a0c3acc2a4c2aac3a4c3abc2a0c3acc2a4c2aa4d | テ、テォツ?テャツ、ツェテ、テォツ?テャツ、ツェM |
EUC-JP | c3a4c3abc2a0c3acc2a4c2aac3a4c3abc2a0c3acc2a4c2aa4d | 辰谷?狸造捉辰谷?狸造捉M |
UTF-8 | c3a4c3abc2a0c3acc2a4c2aac3a4c3abc2a0c3acc2a4c2aa4d | äë 줪äë 줪M |
UHC | c3a4c3abc2a0c3acc2a4c2aac3a4c3abc2a0c3acc2a4c2aa4d | 채챘혻챙짚짧채챘혻챙짚짧M |