Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	災肯?臼	10001101110100001000110101101101001111111000100101010000	8dd08d6d3f8950
EUC-JP	災肯?臼	10111010110100101011100111001110001111111011000110110001	bad2b9ce3fb1b1
UTF-8	災肯렕臼	111001111000000110111101111010001000001010101111111010111010000010010101111010001000011110111100	e781bde882afeba095e887bc
UHC	災肯렕臼	1110111010101100110100001110100110001110101010101100111110111111	eeacd0e98eaacfbf

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)