同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | e4b8b9e5adabe4b8b9e5adab | 丹å«ä¸¹å« |
SJIS-WIN | e4b8b9e5adabe4b8b9e5adab | 荳ケ蟄ォ荳ケ蟄ォ |
EUC-JP | e4b8b9e5adabe4b8b9e5adab | 筝劫?筝劫? |
UTF-8 | e4b8b9e5adabe4b8b9e5adab | 丹孫丹孫 |
UHC | e4b8b9e5adabe4b8b9e5adab | 訝밧?訝밧? |