Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??T??TB	00111111001111110101010000111111001111110101010001000010	3f3f543f3f5442
SJIS-WIN	鴆自T鴆自TB	1110100111101111100011101010100101010100111010011110111110001110101010010101010001000010	e9ef8ea954e9ef8ea95442
EUC-JP	鴆自T鴆自TB	1111001011110001101111001010101101010100111100101111000110111100101010110101010001000010	f2f1bcab54f2f1bcab5442
UTF-8	鴆自T鴆自TB	111010011011010010000110111010001000011110101010010101001110100110110100100001101110100010000111101010100101010001000010	e9b486e887aa54e9b486e887aa5442
UHC	?自T?自TB	001111111110110110111011010101000011111111101101101110110101010001000010	3fedbb543fedbb5442

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)