Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???????E	0011111100111111001111110011111100111111001111110011111101000101	3f3f3f3f3f3f3f45
SJIS-WIN	???????E	0011111100111111001111110011111100111111001111110011111101000101	3f3f3f3f3f3f3f45
EUC-JP	???????E	0011111100111111001111110011111100111111001111110011111101000101	3f3f3f3f3f3f3f45
UTF-8	책첩챔챠혗혡혣E	11101100101100011000010111101100101100101010100111101100101100011001010011101100101100011010000011101101100110001001011111101101100110001010000111101101100110001010001101000101	ecb185ecb2a9ecb194ecb1a0ed9897ed98a1ed98a345
UHC	책첩챔챠혗혡혣E	110000111010010111000011101110001100001110101000110000111010110111000010100000101100001010001010110000101000110001000101	c3a5c3b8c3a8c3adc282c28ac28c45

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)