Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	意??淫ｋ?	100010001101001100111111001111111000100011111010100000101000101100111111	88d33f3f88fa828b3f
EUC-JP	意??淫ｋ?	101100001101010100111111001111111011000011111100101000111110101100111111	b0d53f3fb0fca3eb3f
UTF-8	意쒕젪淫ｋㅇ	111001101000010010001111111011001001001010010101111011001010000010101010111001101011011110101011111011111011110110001011111000111000010110000111	e6848fec9295eca0aae6b7abefbd8be38587
UHC	意쒕젪淫ｋㅇ	111010111111001010011100111010111010000010100010111010111110001010100011111010111010010010110111	ebf29ceba0a2ebe2a3eba4b7

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)