Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	嶸??揖?	11111010101101000011111100111111100101110100101100111111	fab43f3f974b3f
EUC-JP	嶸??揖?	1000111110111011111101000011111100111111110011011010110000111111	8fbbf43f3fcdac3f
UTF-8	嶸뗢댙揖볿	111001011011011010111000111010111001011110100010111010111000110010011001111001101000111110010110111010111011001110111111	e5b6b8eb97a2eb8c99e68f96ebb3bf
UHC	嶸뗢댙揖볿	11100111101011101000101111100010100010001011110111101011111001111001010001000010	e7ae8be288bdebe79442

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)