Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	佶營デ茖	1001100011001001100110100111101010000011011001101110010010100001	98c99a7a8366e4a1
EUC-JP	佶營デ茖	1101000011001011110100111101101110100101110001111110100010100011	d0cbd3dba5c7e8a3
UTF-8	佶營デ茖	111001001011110110110110111001111000011110011111111000111000001110000111111010001000110010010110	e4bdb6e7879fe38387e88c96
UHC	佶營デ?	11010001110011011110011110111101101010111100011100111111	d1cde7bdabc73f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)