Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	陞ｳ貊謎ｸⅨ	11101000100111101011001111100110101110111001001111100100101110001000011101011100	e89eb3e6bb93e4b8875c
EUC-JP	陞ｳ貊謎ｸ?	1110111111111110100011101011001111101100101111011100011011100110100011101011100000111111	effe8eb3ecbdc6e68eb83f
UTF-8	陞ｳ貊謎ｸⅨ	111010011001100110011110111011111011110110110011111010001011001010001010111010001010110010001110111011111011110110111000111000101000010110101000	e9999eefbdb3e8b28ae8ac8eefbdb8e285a8
UHC	陞?貊謎?Ⅸ	11100011101100110011111111011000111001111101101010111010001111111010010110111000	e3b33fd8e7daba3fa5b8

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)