Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???????	00111111001111110011111100111111001111110011111100111111	3f3f3f3f3f3f3f
SJIS-WIN	???焉???	0011111100111111001111111110000010000001001111110011111100111111	3f3f3fe0813f3f3f
EUC-JP	???焉???	0011111100111111001111111101111111100001001111110011111100111111	3f3f3fdfe13f3f3f
UTF-8	뤚쫷쾹焉렠씌롈	111010111010010010011010111011001010101110110111111011001011111010111001111001111000010010001001111010111010000010100000111011001001010010001100111010111010000110001000	eba49aecabb7ecbeb9e78489eba0a0ec948ceba188
UHC	뤚쫷쾹焉렠씌롈	1000111111001001101001101000111010110010100011111110010111101010100011101011000110111110101110101000111011001110	8fc9a68eb28fe5ea8eb1beba8ece

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)