Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	ｸ齊ｪ痔鵰	11110000101001101011100011101010100011101010101010001110101001001111110001000111	f0a6b8ea8eaa8ea4fc47
EUC-JP	?ｸ齊ｪ痔鵰	001111111000111010111000111100111110111010001110101010101011110010100110100011111110101111111011	3f8eb8f3ee8eaabca68febfb
UTF-8	ｸ齊ｪ痔鵰	111011101000000110100101111011111011110110111000111010011011110110001010111011111011110110101010111001111001011110010100111010011011010110110000	ee81a5efbdb8e9bd8aefbdaae79794e9b5b0
UHC	??齊?痔?	0011111100111111111100001011101000111111111101101100000000111111	3f3ff0ba3ff6c03f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)