Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	汚收?碎壤	100010011001100010011101101111100011111111100001111010101001101011011111	89989dbe3fe1ea9adf
EUC-JP	汚收?碎壤	101100011111100011011010110000000011111111100010111011001101010011100001	b1f8dac03fe2ecd4e1
UTF-8	汚收玲碎壤	111001101011000110011010111001101001010010110110111011111010011010101101111001111010001010001110111001011010001110100100	e6b19ae694b6efa6ade7a28ee5a3a4
UHC	汚收玲碎壤	11100111111111011110001010100101111001111011111111100001111011111110010110111101	e7fde2a5e7bfe1efe5bd

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)