Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	史俯瞳史考	10001110011010101001100011101011100100111011010110001110011010101000110101101100	8e6a98eb93b58e6a8d6c
EUC-JP	史俯瞳史考	10111011110010111101000011101101110001101011011110111011110010111011100111001101	bbcbd0edc6b7bbcbb9cd
UTF-8	史俯瞳史考	111001011000111110110010111001001011111110101111111001111001111010110011111001011000111110110010111010001000000010000011	e58fb2e4bfafe79eb3e58fb2e88083
UHC	史俯瞳史考	11011110110010001101110011110110110101001101101011011110110010001100110111000101	dec8dcf6d4dadec8cdc5

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)