同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | e4b8b9e4b8b9e4b8b9e5ad987e | 丹丹丹å~ |
SJIS-WIN | e4b8b9e4b8b9e4b8b9e5ad987e | 荳ケ荳ケ荳ケ蟄? |
EUC-JP | e4b8b9e4b8b9e4b8b9e5ad987e | 筝剛弦筝劫?~ |
UTF-8 | e4b8b9e4b8b9e4b8b9e5ad987e | 丹丹丹存~ |
UHC | e4b8b9e4b8b9e4b8b9e5ad987e | 訝밥많訝밧춼~ |