Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	阡｣闢醍汚	111010001001010010100011111010001001001110010001111001111000100110011000	e894a3e89391e78998
EUC-JP	阡｣闢醍汚	11101111111101001000111010100011111011111111001111000010111010011011000111111000	eff48ea3eff3c2e9b1f8
UTF-8	阡｣闢醍汚	111010011001100010100001111011111011110110100011111010011001011110100010111010011000011010001101111001101011000110011010	e998a1efbda3e997a2e9868de6b19a
UHC	阡?闢醍汚	111101001100011000111111110111001010001111110000101101011110011111111101	f4c63fdca3f0b5e7fd

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)