Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	韭ｻ繧茨ｼ	1110100011101010101110111110001110000010100010001110111110111100	e8eabbe38288efbc
EUC-JP	韭ｻ繧茨ｼ	11110000111011001000111010111011111001011110001010110000111100011000111010111100	f0ec8ebbe5e2b0f18ebc
UTF-8	韭ｻ繧茨ｼ	111010011001111110101101111011111011110110111011111001111011100110100111111010001000110010101000111011111011110110111100	e99fadefbdbbe7b9a7e88ca8efbdbc
UHC	???茨?	001111110011111100111111111011011011110000111111	3f3f3fedbc3f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)