Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????^	00111111001111110011111100111111001111110011111101011110	3f3f3f3f3f3f5e
SJIS-WIN	盂ﾕﾐ盂ﾕﾐ^	111000011011000111010101110100001110000110110001110101011101000001011110	e1b1d5d0e1b1d5d05e
EUC-JP	盂ﾕﾐ盂ﾕﾐ^	11100010101100111000111011010101100011101101000011100010101100111000111011010101100011101101000001011110	e2b38ed58ed0e2b38ed58ed05e
UTF-8	盂ﾕﾐ盂ﾕﾐ^	11100111100110111000001011101111101111101001010111101111101111101001000011100111100110111000001011101111101111101001010111101111101111101001000001011110	e79b82efbe95efbe90e79b82efbe95efbe905e
UHC	盂??盂??^	111010011101110100111111001111111110100111011101001111110011111101011110	e9dd3f3fe9dd3f3f5e

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)