Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????BF	001111110011111100111111001111110100001001000110	3f3f3f3f4246
SJIS-WIN	蜀ｶ甯ｷBF	1110010110000110101101101111101010101000101101110100001001000110	e586b6faa8b74246
EUC-JP	蜀ｶ甯ｷBF	1110100111100110100011101011011010001111110011011010101010001110101101110100001001000110	e9e68eb68fcdaa8eb74246
UTF-8	蜀ｶ甯ｷBF	1110100010011100100000001110111110111101101101101110011110010100101011111110111110111101101101110100001001000110	e89c80efbdb6e794afefbdb74246
UHC	蜀???BF	11110101101110010011111100111111001111110100001001000110	f5b93f3f3f4246

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)