同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | 10010010010101001001000110111100100100011010100010010010010011011001000110011111 | T¼¨M |
SJIS-WIN | 10010010010101001001000110111100100100011010100010010010010011011001000110011111 | 探他捉樽臓 |
EUC-JP | 10010010010101001001000110111100100100011010100010010010010011011001000110011111 | ?T???M?? |
UTF-8 | 10010010010101001001000110111100100100011010100010010010010011011001000110011111 | ?T?????M?? |
UHC | 10010010010101001001000110111100100100011010100010010010010011011001000110011111 | 뭈뫜뫅묺몷 |