Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????M	0011111100111111001111110011111101001101	3f3f3f3f4d
SJIS-WIN	謝自謝嫉M	100011101101001110001110101010011000111011010011100011101011100101001101	8ed38ea98ed38eb94d
EUC-JP	謝自謝嫉M	101111001101010110111100101010111011110011010101101111001011101101001101	bcd5bcabbcd5bcbb4d
UTF-8	謝自謝嫉M	11101000101011001001110111101000100001111010101011101000101011001001110111100101101010111000100101001101	e8ac9de887aae8ac9de5ab894d
UHC	謝自謝嫉M	110111101111001111101101101110111101111011110011111100101110110001001101	def3edbbdef3f2ec4d

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)