Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???????	00111111001111110011111100111111001111110011111100111111	3f3f3f3f3f3f3f
SJIS-WIN	??????霓	0011111100111111001111110011111100111111001111111110100010111101	3f3f3f3f3f3fe8bd
EUC-JP	??????霓	0011111100111111001111110011111100111111001111111111000010111111	3f3f3f3f3f3ff0bf
UTF-8	琉욜썟理뚧엲霓	111011111010011110001100111011001001101010011100111011001000110110011111111011111010011110100100111010111001101010100111111011001001011110110010111010011001110010010011	efa78cec9a9cec8d9fefa7a4eb9aa7ec97b2e99c93
UHC	琉욜썟理뚧엲霓	1110101110100100101111111110011110011011100100101110110010110101100011001110011010011110100001111110011111100111	eba4bfe79b92ecb58ce69e87e7e7

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)