Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	谿雅ｾｧ鬢	1110011010101110100010011110101110111110101001111110100110100100	e6ae89ebbea7e9a4
EUC-JP	谿雅ｾｧ鬢	11101100101100001011001011101101100011101011111010001110101001111111001010100110	ecb0b2ed8ebe8ea7f2a6
UTF-8	谿雅ｾｧ鬢	111010001011000010111111111010011001101110000101111011111011110110111110111011111011110110100111111010011010110010100010	e8b0bfe99b85efbdbeefbda7e9aca2
UHC	谿雅???	11001101101011001110010010111010001111110011111100111111	cdace4ba3f3f3f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)