Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	閻ｸ彧｡謌械	11101000100001011011100011111010101110011010000111100110100010001000101001000010	e885b8fab9a1e6888a42
EUC-JP	閻ｸ彧｡謌械	11101111111001011000111010111000100011111011110011111110100011101010000111101011111010001011001110100011	efe58eb88fbcfe8ea1ebe8b3a3
UTF-8	閻ｸ彧｡謌械	111010011001011010111011111011111011110110111000111001011011110110100111111011111011110110100001111010001010110010001100111001101010001010110000	e996bbefbdb8e5bda7efbda1e8ac8ce6a2b0
UHC	閻?彧??械	111001111010001000111111111010011110111000111111001111111100110011111110	e7a23fe9ee3f3fccfe

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)