Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???C??	001111110011111100111111010000110011111100111111	3f3f3f433f3f
SJIS-WIN	奪臓蔵C竪足	1001001001000100100100011001111110010001101000000100001110010010010001111001000110101011	9244919f91a043924791ab
EUC-JP	奪臓蔵C竪足	1100001110100101110000101010000111000010101000100100001111000011101010001100001010101101	c3a5c2a1c2a243c3a8c2ad
UTF-8	奪臓蔵C竪足	11100101101001011010101011101000100001111001001111101000100101001011010101000011111001111010101110101010111010001011011010110011	e5a5aae88793e894b543e7abaae8b6b3
UHC	奪??C竪足	111101111010110000111111001111110100001111100010101101011111000011101011	f7ac3f3f43e2b5f0eb

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)