Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????h	0011111100111111001111110011111101101000	3f3f3f3f68
SJIS-WIN	癌央癌央h	100010101110000010001001100110111000101011100000100010011001101101101000	8ae0899b8ae0899b68
EUC-JP	癌央癌央h	101101001110001010110001111110111011010011100010101100011111101101101000	b4e2b1fbb4e2b1fb68
UTF-8	癌央癌央h	11100111100110011000110011100101101001001010111011100111100110011000110011100101101001001010111001101000	e7998ce5a4aee7998ce5a4ae68
UHC	癌央癌央h	111001001101111111100100111001111110010011011111111001001110011101101000	e4dfe4e7e4dfe4e768

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)