Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	圻儡伶暉	1001101010101011100110010101001110010111111000001001110111110100	9aab995397e09df4
EUC-JP	圻儡伶暉	1101010010101101110100011011010011001110111000101101101011110110	d4add1b4cee2daf6
UTF-8	圻儡伶暉	111001011001110010111011111001011000010010100001111001001011110010110110111001101001101010001001	e59cbbe584a1e4bcb6e69a89
UHC	圻儡伶暉	1101000011110000110101101110110111010110101101101111110111000111	d0f0d6edd6b6fdc7

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)