同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c3abc3abc290c3abc2a9c2b6 | ëëÂ멶 |
SJIS-WIN | c3abc3abc290c3abc2a9c2b6 | テォテォツ静ォツゥツカ |
EUC-JP | c3abc3abc290c3abc2a9c2b6 | 谷谷?谷息其 |
UTF-8 | c3abc3abc290c3abc2a9c2b6 | ëë멶 |
UHC | c3abc3abc290c3abc2a9c2b6 | 챘챘혨챘짤쨋 |