Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????h	0011111100111111001111110011111101101000	3f3f3f3f68
SJIS-WIN	謝鹿謝?h	1000111011010011100011101010110110001110110100110011111101101000	8ed38ead8ed33f68
EUC-JP	謝鹿謝?h	1011110011010101101111001010111110111100110101010011111101101000	bcd5bcafbcd53f68
UTF-8	謝鹿謝罹h	11101000101011001001110111101001101110011011111111101000101011001001110111101111101001111010011001101000	e8ac9de9b9bfe8ac9defa7a668
UHC	謝鹿謝罹h	110111101111001111010110111000111101111011110011111011001011101001101000	def3d6e3def3ecba68

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)