Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	午??厓?．	100011001101111100111111001111111111101010001101001111111000000101000100	8cdf3f3ffa8d3f8144
EUC-JP	午??厓?．	10111000111000010011111100111111100011111011010011000111001111111010000110100101	b8e13f3f8fb4c73fa1a5
UTF-8	午닺뀛厓뽪．	111001011000110110001000111010111000101110111010111010111000000010011011111001011000111010010011111010111011110110101010111011111011110010001110	e58d88eb8bbaeb809be58e93ebbdaaefbc8e
UHC	午닺뀛厓뽪．	111001111110110110110100111010001000010110010100111001001110110110010110111001101010001110101110	e7edb4e88594e4ed96e6a3ae

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)