Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????AB	001111110011111100111111001111110100000101000010	3f3f3f3f4142
SJIS-WIN	兪???AB	10011001011000000011111100111111001111110100000101000010	99603f3f3f4142
EUC-JP	兪???AB	11010001110000010011111100111111001111110100000101000010	d1c13f3f3f4142
UTF-8	兪롔렼설AB	1110010110000101101010101110101110100001100101001110101110100000101111001110110010000100101001000100000101000010	e585aaeba194eba0bcec84a44142
UHC	兪롔렼설AB	11101010111001001000111011011000100011101100010010111100101100110100000101000010	eae48ed88ec4bcb34142

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)