Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?T?Th	0011111101010100001111110101010001101000	3f543f5468
SJIS-WIN	奪T奪Th	10010010010001000101010010010010010001000101010001101000	92445492445468
EUC-JP	奪T奪Th	11000011101001010101010011000011101001010101010001101000	c3a554c3a55468
UTF-8	奪T奪Th	111001011010010110101010010101001110010110100101101010100101010001101000	e5a5aa54e5a5aa5468
UHC	奪T奪Th	11110111101011000101010011110111101011000101010001101000	f7ac54f7ac5468

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)