同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | 101111101100011110001110101001111011111011000111100011101010011101001101 | ¾Ç§¾Ç§M |
SJIS-WIN | 101111101100011110001110101001111011111011000111100011101010011101001101 | セヌ而セヌ而M |
EUC-JP | 101111101100011110001110101001111011111011000111100011101010011101001101 | 焦ァ焦ァM |
UTF-8 | 101111101100011110001110101001111011111011000111100011101010011101001101 | ?ǎ??ǎ?M |
UHC | 101111101100011110001110101001111011111011000111100011101010011101001101 | 악렒악렒M |