Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	殲釋?聖	10011111011100101110011111010111001111111001000010111001	9f72e7d73f90b9
EUC-JP	殲釋?聖	11011101110100111110111011011001001111111100000010111011	ddd3eed93fc0bb
UTF-8	殲釋욶聖	111001101010111010110010111010011000011110001011111011001001101010110110111010001000000110010110	e6aeb2e9878bec9ab6e88196
UHC	殲釋욶聖	1110000011101000111000001011011110011111010010111110000110100001	e0e8e0b79f4be1a1

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)