Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	鄒ｶ鬧亥ｾ徒	11100111101111101011011011101001101001111000100011100101101111101001001101101011	e7beb6e9a788e5be936b
EUC-JP	鄒ｶ鬧亥ｾ徒	111011101100000010001110101101101111001010101001101100001110011110001110101111101100010111001100	eec08eb6f2a9b0e78ebec5cc
UTF-8	鄒ｶ鬧亥ｾ徒	111010011000010010010010111011111011110110110110111010011010110010100111111001001011101010100101111011111011110110111110111001011011111010010010	e98492efbdb6e9aca7e4baa5efbdbee5be92
UHC	鄒?鬧亥?徒	11110101110110110011111111010111101000101111101010100100001111111101001111111001	f5db3fd7a2faa43fd3f9

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)