Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????{d	001111110011111100111111001111110111101101100100	3f3f3f3f7b64
SJIS-WIN	赦湿斜赦{d	10001110110011011000111010111100100011101100111010001110110011010111101101100100	8ecd8ebc8ece8ecd7b64
EUC-JP	赦湿斜赦{d	10111100110011111011110010111110101111001101000010111100110011110111101101100100	bccfbcbebcd0bccf7b64
UTF-8	赦湿斜赦{d	1110100010110101101001101110011010111001101111111110011010010110100111001110100010110101101001100111101101100100	e8b5a6e6b9bfe6969ce8b5a67b64
UHC	赦?斜赦{d	110111101111010100111111110111101101100011011110111101010111101101100100	def53fded8def57b64

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)