Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	豈手紫蝮	1110011010101111100011101110100010001110100001111110010110011101	e6af8ee88e87e59d
EUC-JP	豈手紫蝮	1110110010110001101111001110101010111011111001111110100111111101	ecb1bceabbe7e9fd
UTF-8	豈手紫蝮	111010001011000110001000111001101000100110001011111001111011010010101011111010001001110110101110	e8b188e6898be7b4abe89dae
UHC	豈手紫?	11010001110000101110001010100010111011011011100100111111	d1c2e2a2edb93f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)