Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	貞?ｏ沮諸	100100101110010100111111100000101000111110011111100111001000111110010100	92e53f828f9f9c8f94
EUC-JP	貞?ｏ沮諸	110001001110011100111111101000111110111111011101111111001011110111110100	c4e73fa3efddfcbdf4
UTF-8	貞닷ｏ沮諸	111010001011001010011110111010111000101110110111111011111011110110001111111001101011001010101110111010001010101110111000	e8b29eeb8bb7efbd8fe6b2aee8abb8
UHC	貞닷ｏ沮諸	11101111111101101011010011100101101000111110111111101110110000011111000010110011	eff6b4e5a3efeec1f0b3

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)