同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c3abc3bbc2abc3a8c2adc289 | ëû«è |
SJIS-WIN | c3abc3bbc2abc3a8c2adc289 | テォテサツォティツュツ |
EUC-JP | c3abc3bbc2abc3a8c2adc289 | 谷短束竪足? |
UTF-8 | c3abc3bbc2abc3a8c2adc289 | ëû«è |
UHC | c3abc3bbc2abc3a8c2adc289 | 챘청짬챔짯혟 |