Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???BcB	001111110011111100111111010000100110001101000010	3f3f3f426342
SJIS-WIN	???BcB	001111110011111100111111010000100110001101000010	3f3f3f426342
EUC-JP	???BcB	001111110011111100111111010000100110001101000010	3f3f3f426342
UTF-8	챠혱쨀BcB	111011001011000110100000111011011001100010110001111011001010100010000000010000100110001101000010	ecb1a0ed98b1eca880426342
UHC	챠혱쨀BcB	110000111010110111000010100110001100001010110011010000100110001101000010	c3adc298c2b3426342

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)