Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	荳顔ｷ包ｽｰ	111001001011100010001010111001111011011110010101111011111011110110110000	e4b88ae7b795efbdb0
EUC-JP	荳顔ｷ包ｽｰ	111010001011101010110100111010011000111010110111110010101111000110001110101111011000111010110000	e8bab4e98eb7caf18ebd8eb0
UTF-8	荳顔ｷ包ｽｰ	111010001000110110110011111010011010000110010100111011111011110110110111111001011000110010000101111011111011110110111101111011111011110110110000	e88db3e9a194efbdb7e58c85efbdbdefbdb0
UHC	荳顔?包??	110101001110010111100100110101000011111111111000110100000011111100111111	d4e5e4d43ff8d03f3f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)