同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c3a5c2b5c292c3a5c2b6c29d | åµÂ嶠|
SJIS-WIN | c3a5c2b5c292c3a5c2b6c29d | テ・ツオツ津・ツカツ |
EUC-JP | c3a5c2b5c292c3a5c2b6c29d | 奪袖?奪其? |
UTF-8 | c3a5c2b5c292c3a5c2b6c29d | åµå¶ |
UHC | c3a5c2b5c292c3a5c2b6c29d | 책쨉혪책쨋혶 |