Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?T?KB	0011111101010100001111110100101101000010	3f543f4b42
SJIS-WIN	涌T涌KB	10010111010011110101010010010111010011110100101101000010	974f54974f4b42
EUC-JP	涌T涌KB	11001101101100000101010011001101101100000100101101000010	cdb054cdb04b42
UTF-8	涌T涌KB	111001101011011010001100010101001110011010110110100011000100101101000010	e6b68c54e6b68c4b42
UHC	涌T涌KB	11101001101111110101010011101001101111110100101101000010	e9bf54e9bf4b42

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)