同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | efbdbcefbda4efbdbcefbdb0efbdbcefbda4 | シ、シーシ、 |
SJIS-WIN | efbdbcefbda4efbdbcefbdb0efbdbcefbda4 | ?シ?、?シ?ー?シ?、 |
EUC-JP | efbdbcefbda4efbdbcefbdb0efbdbcefbda4 | 鐔種修鐔種衆鐔種修 |
UTF-8 | efbdbcefbda4efbdbcefbdb0efbdbcefbda4 | シ、シーシ、 |
UHC | efbdbcefbda4efbdbcefbdb0efbdbcefbda4 | 節쇽숴節쇽쉼節쇽숴 |