Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	貂釈借貂牘	11100110101110001000111011011111100011101101100011100110101110001110000010101111	e6b88edf8ed8e6b8e0af
EUC-JP	貂釈借貂牘	11101100101110101011110011100001101111001101101011101100101110101110000010110001	ecbabce1bcdaecbae0b1
UTF-8	貂釈借貂牘	111010001011001010000010111010011000011110001000111001011000000010011111111010001011001010000010111001111000100110011000	e8b282e98788e5809fe8b282e78998
UHC	貂?借貂牘	111101011011000000111111111100111010100011110101101100001101010010111010	f5b03ff3a8f5b0d4ba

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)