Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	?玲???漿	0011111110010111111001100011111100111111001111111001111111110111	3f97e63f3f3f9ff7
EUC-JP	?玲???漿	0011111111001110111010000011111100111111001111111101111011111001	3fcee83f3f3fdef9
UTF-8	뤵玲곧핉쇳漿	111010111010010010110101111001111000111010110010111010101011001110100111111011011001010110001001111011001000011110110011111001101011110010111111	eba4b5e78eb2eab3a7ed9589ec87b3e6bcbf
UHC	뤵玲곧핉쇳漿	100011111110001111010110101111001011000011110000110000001000111010111100111011011110110111101100	8fe3d6bcb0f0c08ebcededec

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)