同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | e5ac96e5ac96e5ac96e5ac964d | å¬å¬å¬å¬M |
SJIS-WIN | e5ac96e5ac96e5ac96e5ac964d | 螫門ャ門ャ門ャ邦 |
EUC-JP | e5ac96e5ac96e5ac96e5ac964d | 絳?絳?絳?絳?M |
UTF-8 | e5ac96e5ac96e5ac96e5ac964d | 嬖嬖嬖嬖M |
UHC | e5ac96e5ac96e5ac96e5ac964d | 爺뽩쵔爺뽩쵔M |