Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????R	00111111001111110011111100111111001111110011111101010010	3f3f3f3f3f3f52
SJIS-WIN	趙??兢??R	111001101110001000111111001111111001100101011101001111110011111101010010	e6e23f3f995d3f3f52
EUC-JP	趙??兢??R	111011001110010000111111001111111101000110111110001111110011111101010010	ece43f3fd1be3f3f52
UTF-8	趙흔렚兢렏렕R	11101000101101101001100111101101100111011001010011101011101000001001101011100101100001011010001011101011101000001000111111101011101000001001010101010010	e8b699ed9d94eba09ae585a2eba08feba09552
UHC	趙흔렚兢렏렕R	11110000111000011100100011100111100011101010110111010000111001111000111010100101100011101010101001010010	f0e1c8e78eadd0e78ea58eaa52

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)