Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???k	00111111001111110011111101101011	3f3f3f6b
SJIS-WIN	髯よ討k	11101001100110011000001011100110100100111010001001101011	e99982e693a26b
EUC-JP	髯よ討k	11110001111110011010010011101000110001101010010001101011	f1f9a4e8c6a46b
UTF-8	髯よ討k	11101001101010111010111111100011100000101000100011101000101010001000111001101011	e9abafe38288e8a88e6b
UHC	?よ討k	001111111010101011101000111101111101000001101011	3faae8f7d06b

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)