Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	霈ﾈ莢ｬ昌	1110100010111100110010001110010010110000101011001000111110111001	e8bcc8e4b0ac8fb9
EUC-JP	霈ﾈ莢ｬ昌	11110000101111101000111011001000111010001011001010001110101011001011111010111011	f0be8ec8e8b28eacbebb
UTF-8	霈ﾈ莢ｬ昌	111010011001110010001000111011111011111010001000111010001000111010100010111011111011110110101100111001101001100010001100	e99c88efbe88e88ea2efbdace6988c
UHC	??莢?昌	00111111001111111111101011111000001111111111001111100011	3f3ffaf83ff3e3

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)