Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	爾汐耳鹿	1000111010100010100011101010110010001110101010001000111010101101	8ea28eac8ea88ead
EUC-JP	爾汐耳鹿	1011110010100100101111001010111010111100101010101011110010101111	bca4bcaebcaabcaf
UTF-8	爾汐耳鹿	111001111000100010111110111001101011000110010000111010001000000010110011111010011011100110111111	e788bee6b190e880b3e9b9bf
UHC	爾汐耳鹿	1110110010110011111000001011000111101100101111001101011011100011	ecb3e0b1ecbcd6e3

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)