Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	赤?樗???	1001000011010100001111111001001010010100001111110011111100111111	90d43f92943f3f3f
EUC-JP	赤?樗???	1100000011010110001111111100001111110100001111110011111100111111	c0d63fc3f43f3f3f
UTF-8	赤렭樗렓柳덴	111010001011010110100100111010111010000010101101111001101010100010010111111010111010000010010011111011111010011110001001111010111000110110110100	e8b5a4eba0ade6a897eba093efa789eb8db4
UHC	赤렭樗렓柳덴	111011101110010110001110101110101110111011000000100011101010100011101010111101111011010110100111	eee58ebaeec08ea8eaf7b5a7

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)