Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??Lh??L	00111111001111110100110001101000001111110011111101001100	3f3f4c683f3f4c
SJIS-WIN	鄙ｳLh鄙ｳL	111001111011111110110011010011000110100011100111101111111011001101001100	e7bfb34c68e7bfb34c
EUC-JP	鄙ｳLh鄙ｳL	1110111011000001100011101011001101001100011010001110111011000001100011101011001101001100	eec18eb34c68eec18eb34c
UTF-8	鄙ｳLh鄙ｳL	111010011000010010011001111011111011110110110011010011000110100011101001100001001001100111101111101111011011001101001100	e98499efbdb34c68e98499efbdb34c
UHC	鄙?Lh鄙?L	110111101010100100111111010011000110100011011110101010010011111101001100	dea93f4c68dea93f4c

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)