Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??	0011111100111111	3f3f
SJIS-WIN	帝℡	10010010111010011000011110000100	92e98784
EUC-JP	帝?	110001001110101100111111	c4eb3f
UTF-8	帝℡	111001011011100010011101111000101000010010100001	e5b89de284a1
UHC	帝℡	11110000101010001010001011100101	f0a8a2e5

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)