Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???TB	0011111100111111001111110101010001000010	3f3f3f5442
SJIS-WIN	鞳器ΣTB	1110100011100011100010101110110110000011101100000101010001000010	e8e38aed83b05442
EUC-JP	鞳器ΣTB	1111000011100101101101001110111110100110101100100101010001000010	f0e5b4efa6b25442
UTF-8	鞳器ΣTB	11101001100111101011001111100101100110011010100011001110101000110101010001000010	e99eb3e599a8cea35442
UHC	?器ΣTB	00111111110100001110111110100101110100100101010001000010	3fd0efa5d25442

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)