Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????B	0011111100111111001111110011111101000010	3f3f3f3f42
SJIS-WIN	貞朧??B	10010010111001011001111001001111001111110011111101000010	92e59e4f3f3f42
EUC-JP	貞朧??B	11000100111001111101101110110000001111110011111101000010	c4e7dbb03f3f42
UTF-8	貞朧렧렡B	11101000101100101001111011100110100111001010011111101011101000001010011111101011101000001010000101000010	e8b29ee69ca7eba0a7eba0a142
UHC	貞朧렧렡B	111011111111011011010110111010001000111010110110100011101011001001000010	eff6d6e88eb68eb242

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)