Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	愁??瞳?	10001111010001000011111100111111100100111011010100111111	8f443f3f93b53f
EUC-JP	愁??瞳?	10111101101001010011111100111111110001101011011100111111	bda53f3fc6b73f
UTF-8	愁공暈瞳건	111001101000010010000001111010101011001110110101111011111010011110000101111001111001111010110011111010101011000110110100	e68481eab3b5efa785e79eb3eab1b4
UHC	愁공暈瞳건	11100001111111101011000011111000111010011111011111010100110110101011000011000111	e1feb0f8e9f7d4dab0c7

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)