Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	髯る㍽骭	1110100110011001100000101110100110000111100011101110100110001100	e99982e9878ee98c
EUC-JP	髯る?骭	11110001111110011010010011101011001111111111000111101100	f1f9a4eb3ff1ec
UTF-8	髯る㍽骭	111010011010101110101111111000111000001010001011111000111000110110111101111010011010101010101101	e9abafe3828be38dbde9aaad
UHC	?る??	0011111110101010111010110011111100111111	3faaeb3f3f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)