Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	??殞?阻龍	001111110011111110011111011011010011111110010001011010101001011110110100	3f3f9f6d3f916a97b4
EUC-JP	佺?殞?阻龍	1000111110110000111110010011111111011101110011100011111111000001110010111100111010110110	8fb0f93fddce3fc1cbceb6
UTF-8	佺렯殞렓阻龍	111001001011110110111010111010111010000010101111111001101010111010011110111010111010000010010011111010011001100010111011111010011011111010001101	e4bdbaeba0afe6ae9eeba093e998bbe9be8d
UHC	佺렯殞렓阻龍	111011101110110110001110101111001110100111111001100011101010100011110000111001101101011110100011	eeed8ebce9f98ea8f0e6d7a3

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)