Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????^	0011111100111111001111110011111101011110	3f3f3f3f5e
SJIS-WIN	姪?姪?^	10010110110000110011111110010110110000110011111101011110	96c33f96c33f5e
EUC-JP	姪?姪?^	11001100110001010011111111001100110001010011111101011110	ccc53fccc53f5e
UTF-8	姪샬姪샬^	11100101101001111010101011101100100000111010110011100101101001111010101011101100100000111010110001011110	e5a7aaec83ace5a7aaec83ac5e
UHC	姪샬姪샬^	111100101110101110111100101000111111001011101011101111001010001101011110	f2ebbca3f2ebbca35e

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)