Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???	001111110011111100111111	3f3f3f
SJIS-WIN	譴昶飭	111001101010001010011101111000101001100110101010	e6a29de299aa
EUC-JP	譴昶飭	111011001010010011011010111001001101001010101100	eca4dae4d2ac
UTF-8	譴昶飭	111010001010110110110100111001101001100010110110111010011010001110101101	e8adb4e698b6e9a3ad
UHC	譴昶飭	110011001011100111110011111001001111011011010000	ccb9f3e4f6d0

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)