Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?}v?}vB	00111111011111010111011000111111011111010111011001000010	3f7d763f7d7642
SJIS-WIN	癌}v癌}vB	100010101110000001111101011101101000101011100000011111010111011001000010	8ae07d768ae07d7642
EUC-JP	癌}v癌}vB	101101001110001001111101011101101011010011100010011111010111011001000010	b4e27d76b4e27d7642
UTF-8	癌}v癌}vB	1110011110011001100011000111110101110110111001111001100110001100011111010111011001000010	e7998c7d76e7998c7d7642
UHC	癌}v癌}vB	111001001101111101111101011101101110010011011111011111010111011001000010	e4df7d76e4df7d7642

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)