Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	ｾ鮨韜骼ｱ	11110010101111111011111011101001101111011110100011101001111010011000111010110001	f2bfbee9bde8e9e98eb1
EUC-JP	?ｾ鮨韜骼ｱ	0011111110001110101111101111001010111111111100001110101111110001111011101000111010110001	3f8ebef2bff0ebf1ee8eb1
UTF-8	ｾ鮨韜骼ｱ	111011101000011110110110111011111011110110111110111010011010111010101000111010011001111110011100111010011010101010111100111011111011110110110001	ee87b6efbdbee9aea8e99f9ce9aabcefbdb1
UHC	???韜??	00111111001111110011111111010100101101110011111100111111	3f3f3fd4b73f3f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)