Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????]	001111110011111100111111001111110011111101011101	3f3f3f3f3f5d
SJIS-WIN	ｾ謗ｻ爵宍]	101111101110011010001110101110111000111011011101100011101011001101011101	bee68ebb8edd8eb35d
EUC-JP	ｾ謗ｻ爵宍]	1000111010111110111010111110111010001110101110111011110011011111101111001011010101011101	8ebeebee8ebbbcdfbcb55d
UTF-8	ｾ謗ｻ爵宍]	11101111101111011011111011101000101011001001011111101111101111011011101111100111100010001011010111100101101011101000110101011101	efbdbee8ac97efbdbbe788b5e5ae8d5d
UHC	?謗?爵?]	0011111111011011101111110011111111101101110010010011111101011101	3fdbbf3fedc93f5d

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)