Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	七遙ｼｽ	11110000101001001000111010110101111010101010000110111100111100011000111010111101	f0a48eb5eaa1bcf18ebd
EUC-JP	?七遙ｼ?ｽ	00111111101111001011011111110100101000111000111010111100001111111000111010111101	3fbcb7f4a38ebc3f8ebd
UTF-8	七遙ｼｽ	111011101000000110100011111001001011100010000011111010011000000110011001111011111011110110111100111011101000010010001001111011111011110110111101	ee81a3e4b883e98199efbdbcee8489efbdbd
UHC	?七遙???	0011111111110110110100101110100110101011001111110011111100111111	3ff6d2e9ab3f3f3f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)