Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	訂鞨??潔汁	10010010111110011110100011100000001111110011111110001100100010011000111101100000	92f9e8e03f3f8c898f60
EUC-JP	訂鞨??潔汁	11000100111110111111000011100010001111110011111110110111111010011011110111000001	c4fbf0e23f3fb7e9bdc1
UTF-8	訂鞨렣뜸潔汁	111010001010100010000010111010011001111010101000111010111010000010100011111010111001110010111000111001101011110110010100111001101011000110000001	e8a882e99ea8eba0a3eb9cb8e6bd94e6b181
UHC	訂鞨렣뜸潔汁	111011111111010011001010111010101000111010110100101101101110010011001100101111101111000111110000	eff4caea8eb4b6e4ccbef1f0

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)