Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	乙??淫??	1000100110110011001111110011111110001000111110100011111100111111	89b33f3f88fa3f3f
EUC-JP	乙??淫??	1011001010110101001111110011111110110000111111000011111100111111	b2b53f3fb0fc3f3f
UTF-8	乙좄꼬淫띠뀺	111001001011100110011001111011001010001010000100111010101011110010101100111001101011011110101011111010111001110110100000111010111000000010111010	e4b999eca284eabcace6b7abeb9da0eb80ba
UHC	乙좄꼬淫띠뀺	111010111110000010100000111010001011001010111111111010111110001010110110111011001000010110110000	ebe0a0e8b2bfebe2b6ec85b0

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)