Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	?功ぢ??	00111111100011001111011110000010110000000011111100111111	3f8cf782c03f3f
EUC-JP	?功ぢ??	00111111101110001111100110100100110000100011111100111111	3fb8f9a4c23f3f
UTF-8	룴功ぢ룵쾹	111010111010001110110100111001011000101010011111111000111000000110100010111010111010001110110101111011001011111010111001	eba3b4e58a9fe381a2eba3b5ecbeb9
UHC	룴功ぢ룵쾹	10001111101010011100110111101101101010101100001010001111101010101011001010001111	8fa9cdedaac28faab28f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)