Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	譽壽球褊ザ	11100110101000111001101011100110100010111000010111100101111011011000001101010101	e6a39ae68b85e5ed8355
EUC-JP	譽壽球褊ザ	11101100101001011101010011101000101101011110010111101010111011111010010110110110	eca5d4e8b5e5eaefa5b6
UTF-8	譽壽球褊ザ	111010001010110110111101111001011010001110111101111001111001000010000011111010001010010010001010111000111000001010110110	e8adbde5a3bde79083e8a48ae382b6
UHC	譽壽球?ザ	111001111110001011100001111110001100111110111001001111111010101110110110	e7e2e1f8cfb93fabb6

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)