Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???	001111110011111100111111	3f3f3f
SJIS-WIN	葯糾示	111001001101111010001011100010101000111010100110	e4de8b8a8ea6
EUC-JP	葯糾示	111010001110000010110101111010101011110010101000	e8e0b5eabca8
UTF-8	葯糾示	111010001001000110101111111001111011001110111110111001111010010010111010	e891afe7b3bee7a4ba
UHC	葯糾示	111001011011010111010000101011001110001111000110	e5b5d0ace3c6

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)