Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???????	00111111001111110011111100111111001111110011111100111111	3f3f3f3f3f3f3f
SJIS-WIN	???功???	0011111100111111001111111000110011110111001111110011111100111111	3f3f3f8cf73f3f3f
EUC-JP	???功ŉ??	00111111001111110011111110111000111110011000111110101001110010100011111100111111	3f3f3fb8f98fa9ca3f3f
UTF-8	룶엌룴功ŉ룶엌	1110101110100011101101101110110010010111100011001110101110100011101101001110010110001010100111111100010110001001111010111010001110110110111011001001011110001100	eba3b6ec978ceba3b4e58a9fc589eba3b6ec978c
UHC	룶엌룴功ŉ룶엌	1000111110101011101111101111110110001111101010011100110111101101101010011011000010001111101010111011111011111101	8fabbefd8fa9cdeda9b08fabbefd

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)