Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	鐔器修鐔醐十	111010000101110010001010111011011000111101000011111010000101110010001100111011011000111101011100	e85c8aed8f43e85c8ced8f5c
EUC-JP	鐔器修鐔醐十	111011111011110110110100111011111011110110100100111011111011110110111000111011111011110110111101	efbdb4efbda4efbdb8efbdbd
UTF-8	鐔器修鐔醐十	111010011001000010010100111001011001100110101000111001001011111110101110111010011001000010010100111010011000011010010000111001011000110110000001	e99094e599a8e4bfaee99094e98690e58d81
UHC	?器修??十	001111111101000011101111111000011111001100111111001111111110010010101000	3fd0efe1f33f3fe4a8

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)