Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???????	00111111001111110011111100111111001111110011111100111111	3f3f3f3f3f3f3f
SJIS-WIN	??????甸	0011111100111111001111110011111100111111001111111001100110110010	3f3f3f3f3f3f99b2
EUC-JP	??????甸	0011111100111111001111110011111100111111001111111101001010110100	3f3f3f3f3f3fd2b4
UTF-8	閱곕젔轢욜뱩甸	111010011001011010110001111010101011001110010101111011001010000010010100111011111010011010001101111011001001101010011100111010111011000110101001111001111001010010111000	e996b1eab395eca094efa68dec9a9cebb1a9e794b8
UHC	閱곕젔轢욜뱩甸	1110011011110011101100001110101110100000100100101110011010111100101111111110011110010011100011111110111110100100	e6f3b0eba092e6bcbfe7938fefa4

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)