Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????B	00111111001111110011111100111111001111110011111101000010	3f3f3f3f3f3f42
SJIS-WIN	巍????猥B	100110111101100100111111001111110011111100111111111000001100111001000010	9bd93f3f3f3fe0ce42
EUC-JP	巍????猥B	110101101101101100111111001111110011111100111111111000001101000001000010	d6db3f3f3f3fe0d042
UTF-8	巍렯롏렯렍猥B	11100101101101111000110111101011101000001010111111101011101000011000111111101011101000001010111111101011101000001000110111100111100011001010010101000010	e5b78deba0afeba18feba0afeba08de78ca542
UHC	巍렯롏렯렍猥B	11101000111001001000111010111100100011101101010110001110101111001000111010100011111010001110010101000010	e8e48ebc8ed58ebc8ea3e8e542

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)