同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c2bcc2bec2bcc2a5c2bec3bbc2aac3 | ¼¾¼¥¾ûªà |
SJIS-WIN | c2bcc2bec2bcc2a5c2bec3bbc2aac3 | ツシツセツシツ・ツセテサツェテ |
EUC-JP | c2bcc2bec2bcc2a5c2bec3bbc2aac3 | 村他村促他短捉 |
UTF-8 | c2bcc2bec2bcc2a5c2bec3bbc2aac3 | ¼¾¼¥¾ûª? |
UHC | c2bcc2bec2bcc2a5c2bec3bbc2aac3 | 쩌쩐쩌짜쩐청짧 |