Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??Lh??L	00111111001111110100110001101000001111110011111101001100	3f3f4c683f3f4c
SJIS-WIN	障菰Lh障菰L	1000111111100001100011001101010001001100011010001000111111100001100011001101010001001100	8fe18cd44c688fe18cd44c
EUC-JP	障菰Lh障菰L	1011111011100011101110001101011001001100011010001011111011100011101110001101011001001100	bee3b8d64c68bee3b8d64c
UTF-8	障菰Lh障菰L	111010011001101010011100111010001000111110110000010011000110100011101001100110101001110011101000100011111011000001001100	e99a9ce88fb04c68e99a9ce88fb04c
UHC	障菰Lh障菰L	1110111010100001110011011100101001001100011010001110111010100001110011011100101001001100	eea1cdca4c68eea1cdca4c

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)