Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	盖疼俾毬	1110000110110011111000010111010110011000111010101001111101111011	e1b3e17598ea9f7b
EUC-JP	盖疼俾毬	1110001010110101111000011101011011010000111011001101110111011100	e2b5e1d6d0ecdddc
UTF-8	盖疼俾毬	111001111001101110010110111001111001011010111100111001001011111110111110111001101010111110101100	e79b96e796bce4bfbee6afac
UHC	盖疼?毬	11001011110011001101010011011001001111111100111110110011	cbccd4d93fcfb3

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)