Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	邉堤ｹ晁験	111001111011001110010010111001111011100110011101111010001000110010110001	e7b392e7b99de88cb1
EUC-JP	邉堤ｹ晁験	11101110101101011100010011101001100011101011100111011010111010101011100010110011	eeb5c4e98eb9daeab8b3
UTF-8	邉堤ｹ晁験	111010011000001010001001111001011010000010100100111011111011110110111001111001101001100110000001111010011010100010010011	e98289e5a0a4efbdb9e69981e9a893
UHC	?堤?晁?	00111111111100001010011100111111111100001100010100111111	3ff0a73ff0c53f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)