Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	隘櫁ご蠑ｷ	111010001010010110011110111010001000001010110010111001011011110010110111	e8a59ee882b2e5bcb7
EUC-JP	隘櫁ご蠑ｷ	11110000101001111101110011101010101001001011010011101010101111101000111010110111	f0a7dceaa4b4eabe8eb7
UTF-8	隘櫁ご蠑ｷ	111010011001101010011000111001101010101110000001111000111000000110010100111010001010000010010001111011111011110110110111	e99a98e6ab81e38194e8a091efbdb7
UHC	隘?ご??	11100100111101100011111110101010101101000011111100111111	e4f63faab43f3f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)