Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	閻駆棘岺	1110100010000101100010111110110010011110100110011111101010101101	e8858bec9e99faad
EUC-JP	閻駆棘岺	111011111110010110110110111011101101101111111001100011111011101110111000	efe5b6eedbf98fbbb8
UTF-8	閻駆棘岺	111010011001011010111011111010011010011110000110111001101010001110011000111001011011001010111010	e996bbe9a786e6a398e5b2ba
UHC	閻?棘岺	11100111101000100011111111010000101111101101011010111001	e7a23fd0bed6b9

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)