Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????B	001111110011111100111111001111110011111101000010	3f3f3f3f3f42
SJIS-WIN	午??誼?B	1000110011011111001111110011111110001011011000100011111101000010	8cdf3f3f8b623f42
EUC-JP	午??誼?B	1011100011100001001111110011111110110101110000110011111101000010	b8e13f3fb5c33f42
UTF-8	午대끂誼뾖B	11100101100011011000100011101011100011001000000011101011100000011000001011101000101010101011110011101011101111101001011001000010	e58d88eb8c80eb8182e8aabcebbe9642
UHC	午대끂誼뾖B	1110011111101101101101001110101110000101101110001110101111111110100101110101001101000010	e7edb4eb85b8ebfe975342

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)