Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???BB	0011111100111111001111110100001001000010	3f3f3f4242
SJIS-WIN	鐔常舟BB	1110100001011100100011111110110110001111010011010100001001000010	e85c8fed8f4d4242
EUC-JP	鐔常舟BB	1110111110111101101111101110111110111101101011100100001001000010	efbdbeefbdae4242
UTF-8	鐔常舟BB	1110100110010000100101001110010110111000101110001110100010001000100111110100001001000010	e99094e5b8b8e8889f4242
UHC	?常舟BB	00111111110111111100100011110001110001110100001001000010	3fdfc8f1c74242

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)