同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | 111100001010010110100001101100101111000010100101101000011011001001001101 | 𥡲𥡲M |
SJIS-WIN | 111100001010010110100001101100101111000010100101101000011011001001001101 | 。イ。イM |
EUC-JP | 111100001010010110100001101100101111000010100101101000011011001001001101 | 陬_陬_M |
UTF-8 | 111100001010010110100001101100101111000010100101101000011011001001001101 | 𥡲𥡲M |
UHC | 111100001010010110100001101100101111000010100101101000011011001001001101 | 劑〔劑〔M |