同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | e5815ce5815c40e5815ce5815c534d | å\å\@å\å\SM |
SJIS-WIN | e5815ce5815c40e5815ce5815c534d | 蛛\蛛\@蛛\蛛\SM |
EUC-JP | e5815ce5815c40e5815ce5815c534d | ?\?\@?\?\SM |
UTF-8 | e5815ce5815c40e5815ce5815c534d | ?\?\@?\?\SM |
UHC | e5815ce5815c40e5815ce5815c534d | 癌\癌\@癌\癌\SM |