Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????U	0011111100111111001111110011111101010101	3f3f3f3f55
SJIS-WIN	疾式丈ｿU	1000111010111110100011101010111010001111111001001011111101010101	8ebe8eae8fe4bf55
EUC-JP	疾式丈ｿU	101111001100000010111100101100001011111011100110100011101011111101010101	bcc0bcb0bee68ebf55
UTF-8	疾式丈ｿU	11100111100101101011111011100101101111001000111111100100101110001000100011101111101111011011111101010101	e796bee5bc8fe4b888efbdbf55
UHC	疾式丈?U	1111001011110000111000111101001011101101110110110011111101010101	f2f0e3d2eddb3f55

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)