Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	鞜懈拷邯	1110100011011111100111001110011010001101100010011110011110110110	e8df9ce68d89e7b6
EUC-JP	鞜懈拷邯	1111000011100001110110001110100010111001111010011110111010111000	f0e1d8e8b9e9eeb8
UTF-8	鞜懈拷邯	111010011001111010011100111001101000011110001000111001101000101110110111111010011000001010101111	e99e9ce68788e68bb7e982af
UHC	?懈拷邯	00111111111110101010101111001101101110001100101011111011	3ffaabcdb8cafb

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)