Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	裄帛ｵ吾	11100101111000001001101111100101101101011000110011100001	e5e09be5b58ce1
EUC-JP	裄帛ｵ吾	1110101011100010110101101110011110001110101101011011100011100011	eae2d6e78eb5b8e3
UTF-8	裄帛ｵ吾	111010001010001110000100111001011011100010011011111011111011110110110101111001011001000010111110	e8a384e5b89befbdb5e590be
UHC	?帛?吾	001111111101101111011001001111111110011111101110	3fdbd93fe7ee

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)