Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	杖ｈ?輿	10001111111100011000001010001000001111111001011101100000	8ff182883f9760
EUC-JP	杖ｈ?輿	10111110111100111010001111101000001111111100110111000001	bef3a3e83fcdc1
UTF-8	杖ｈ쥉輿	111001101001110110010110111011111011110110001000111011001010010110001001111010001011110010111111	e69d96efbd88eca589e8bcbf
UHC	杖ｈ쥉輿	1110110111101000101000111110100010100010100000101110011010101011	ede8a3e8a282e6ab

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)