Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	煽遡煽粟	1001000011111000100100010110101110010000111110001000100010111110	90f8916b90f888be
EUC-JP	煽遡煽粟	1100000011111010110000011100110011000000111110101011000011000000	c0fac1ccc0fab0c0
UTF-8	煽遡煽粟	111001111000010110111101111010011000000110100001111001111000010110111101111001111011001010011111	e785bde981a1e785bde7b29f
UHC	煽遡煽粟	1110000011000011111000011100111111100000110000111110000111011000	e0c3e1cfe0c3e1d8

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)