Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???	001111110011111100111111	3f3f3f
SJIS-WIN	厭曜襄	100010010111110110010111011010101110010111110101	897d976ae5f5
EUC-JP	厭曜襄	101100011101111011001101110010111110101011110111	b1decdcbeaf7
UTF-8	厭曜襄	111001011000111010101101111001101001101110011100111010001010010110000100	e58eade69b9ce8a584
UHC	厭曜襄	111001101111010011101000111110001110010111010001	e6f4e8f8e5d1

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)