Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	湘逸魘魑	1000111111000011111110111011010011101001101101001110100110110011	8fc3fbb4e9b4e9b3
EUC-JP	湘?魘魑	10111110110001010011111111110010101101101111001010110101	bec53ff2b6f2b5
UTF-8	湘逸魘魑	111001101011100110011000111011111010100010100101111010011010110110011000111010011010110110010001	e6b998efa8a5e9ad98e9ad91
UHC	湘???	1101111111001111001111110011111100111111	dfcf3f3f3f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)