Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	種???慫	10001110111011010011111100111111001111111001110011001111	8eed3f3f3f9ccf
EUC-JP	種???慫	10111100111011110011111100111111001111111101100011010001	bcef3f3f3fd8d1
UTF-8	種비렰렪慫	111001111010100010101110111010111011100110000100111010111010000010110000111010111010000010101010111001101000010110101011	e7a8aeebb984eba0b0eba0aae685ab
UHC	種비렰렪慫	11110000111110101011101011110001100011101011110110001110101110001111000011110110	f0fabaf18ebd8eb8f0f6

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)