Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	霍鯉ｽｹ魄	1110100010110111100011001110111110111101101110011110100110101110	e8b78cefbdb9e9ae
EUC-JP	霍鯉ｽｹ魄	11110000101110011011100011110001100011101011110110001110101110011111001010110000	f0b9b8f18ebd8eb9f2b0
UTF-8	霍鯉ｽｹ魄	111010011001110010001101111010011010111110001001111011111011110110111101111011111011110110111001111010011010110110000100	e99c8de9af89efbdbdefbdb9e9ad84
UHC	?鯉??魄	00111111110101111110111100111111001111111101101111011110	3fd7ef3f3fdbde

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)