Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	訂遁??贈?	100100101111100110010011110110010011111100111111100100011010000100111111	92f993d93f3f91a13f
EUC-JP	訂遁??贈?	110001001111101111000110110110110011111100111111110000101010001100111111	c4fbc6db3f3fc2a33f
UTF-8	訂遁렕렓贈렒	111010001010100010000010111010011000000110000001111010111010000010010101111010111010000010010011111010001011010010001000111010111010000010010010	e8a882e98181eba095eba093e8b488eba092
UHC	訂遁렕렓贈렒	111011111111010011010100111011011000111010101010100011101010100011110001111111001000111010100111	eff4d4ed8eaa8ea8f1fc8ea7

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)