Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	?硅????	00111111111000011110100100111111001111110011111100111111	3fe1e93f3f3f3f
EUC-JP	?硅????	00111111111000101110101100111111001111110011111100111111	3fe2eb3f3f3f3f
UTF-8	을硅뤝느뿅㈇	111011001001110110000100111001111010000110000101111010111010010010011101111010111000101010010000111010111011111110000101111000111000100010000111	ec9d84e7a185eba49deb8a90ebbf85e38887
UHC	을硅뤝느뿅㈇	110000001011101111010000101010011000111111001100101101001100000010111011110100001010100110111000	c0bbd0a98fccb4c0bbd0a9b8

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)