Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?FB	001111110100011001000010	3f4642
SJIS-WIN	癌FB	10001010111000000100011001000010	8ae04642
EUC-JP	癌FB	10110100111000100100011001000010	b4e24642
UTF-8	癌FB	1110011110011001100011000100011001000010	e7998c4642
UHC	癌FB	11100100110111110100011001000010	e4df4642

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)