Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	ﾃ佚ｨﾃ催ソ	110000111001100011000011101010001100001110001101110000111000001101011100	c398c3a8c38dc3835c
EUC-JP	ﾃ佚ｨﾃ催ソ	100011101100001111010000110001011000111010101000100011101100001110111010110001011010010110111101	8ec3d0c58ea88ec3bac5a5bd
UTF-8	ﾃ佚ｨﾃ催ソ	111011111011111010000011111001001011110110011010111011111011110110101000111011111011111010000011111001011000001010101100111000111000001010111101	efbe83e4bd9aefbda8efbe83e582ace382bd
UHC	?佚??催ソ	001111111110110011101010001111110011111111110101110010101010101110111101	3fecea3f3ff5caabbd

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)