Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????B	001111110011111100111111001111110011111101000010	3f3f3f3f3f42
SJIS-WIN	獰??岳?B	1110000011010110001111110011111110001010011110000011111101000010	e0d63f3f8a783f42
EUC-JP	獰?Ŧ岳?B	11100000110110000011111110001111101010011010111110110011110110010011111101000010	e0d83f8fa9afb3d93f42
UTF-8	獰욅Ŧ岳췾B	111001111000110110110000111011001001101010000101110001011010011011100101101100101011001111101100101101111011111001000010	e78db0ec9a85c5a6e5b2b3ecb7be42
UHC	獰욅Ŧ岳췾B	1110011110111110100111101110011110101000101011101110010010111111101011100111011001000010	e7be9ee7a8aee4bfae7642

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)