Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???????	00111111001111110011111100111111001111110011111100111111	3f3f3f3f3f3f3f
SJIS-WIN	悅??????	1111101010111101001111110011111100111111001111110011111100111111	fabd3f3f3f3f3f3f
EUC-JP	???焰???	001111110011111100111111100011111100100111101111001111110011111100111111	3f3f3f8fc9ef3f3f3f
UTF-8	悅덄쓦焰뉔콊咽	111001101000001010000101111010111000110110000100111011001001001110100110111001111000010010110000111010111000100110010100111011001011110110001010111011111010011010011110	e68285eb8d84ec93a6e784b0eb8994ecbd8aefa69e
UHC	悅덄쓦焰뉔콊咽	1110011011101101100010001110011110011101100001111110011011111011100001111110100110110001100001101110011011101100	e6ed88e79d87e6fb87e9b186e6ec

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)