Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??@??@B	00111111001111110100000000111111001111110100000001000010	3f3f403f3f4042
SJIS-WIN	飮?@飮?@B	100111110101101000111111010000001001111101011010001111110100000001000010	9f5a3f409f5a3f4042
EUC-JP	飮?@飮?@B	110111011011101100111111010000001101110110111011001111110100000001000010	ddbb3f40ddbb3f4042
UTF-8	飮쩗@飮쩗@B	111010011010001110101110111011001010100110010111010000001110100110100011101011101110110010101001100101110100000001000010	e9a3aeeca99740e9a3aeeca9974042
UHC	飮쩗@飮쩗@B	1110101111100110101001010100110101000000111010111110011010100101010011010100000001000010	ebe6a54d40ebe6a54d4042

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)