Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	ﾈ齊､悉	1111000111100001110010001110101010001110101001001000111010111011	f1e1c8ea8ea48ebb
EUC-JP	?ﾈ齊､悉	001111111000111011001000111100111110111010001110101001001011110010111101	3f8ec8f3ee8ea4bcbd
UTF-8	ﾈ齊､悉	111011101000010110011100111011111011111010001000111010011011110110001010111011111011110110100100111001101000001010001001	ee859cefbe88e9bd8aefbda4e68289
UHC	??齊?悉	00111111001111111111000010111010001111111110001111111010	3f3ff0ba3fe3fa

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)