Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???	001111110011111100111111	3f3f3f
SJIS-WIN	隧ｷ雍	1110100010101001101101111110100010110100	e8a9b7e8b4
EUC-JP	隧ｷ雍	111100001010101110001110101101111111000010110110	f0ab8eb7f0b6
UTF-8	隧ｷ雍	111010011001101010100111111011111011110110110111111010011001101110001101	e99aa7efbdb7e99b8d
UHC	隧?雍	1110001011001010001111111110100010111100	e2ca3fe8bc

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)