Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????B	001111110011111100111111001111110011111101000010	3f3f3f3f3f42
SJIS-WIN	□⊂?泥?B	100000011010000010000001101111000011111110010011010001000011111101000010	81a081bc3f93443f42
EUC-JP	□⊂?泥?B	101000101010001010100010101111100011111111000101101001010011111101000010	a2a2a2be3fc5a53f42
UTF-8	□⊂룶泥팃B	11100010100101101010000111100010100010101000001011101011101000111011011011100110101100111010010111101101100011001000001101000010	e296a1e28a82eba3b6e6b3a5ed8c8342
UHC	□⊂룶泥팃B	1010000111100000101000011111100010001111101010111101001011111010110001101100001001000010	a1e0a1f88fabd2fac6c242

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)