Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????h	0011111100111111001111110011111101101000	3f3f3f3f68
SJIS-WIN	自汐耳治h	100011101010100110001110101011001000111010101000100011101010000101101000	8ea98eac8ea88ea168
EUC-JP	自汐耳治h	101111001010101110111100101011101011110010101010101111001010001101101000	bcabbcaebcaabca368
UTF-8	自汐耳治h	11101000100001111010101011100110101100011001000011101000100000001011001111100110101100101011101101101000	e887aae6b190e880b3e6b2bb68
UHC	自汐耳治h	111011011011101111100000101100011110110010111100111101101011110101101000	edbbe0b1ecbcf6bd68

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)