Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???B	00111111001111110011111101000010	3f3f3f42
SJIS-WIN	痺掩洪B	11100001100000111000100110000110100011010101111001000010	e18389868d5e42
EUC-JP	痺掩洪B	11100001111000111011000111100110101110011011111101000010	e1e3b1e6b9bf42
UTF-8	痺掩洪B	11100111100101111011101011100110100011101010100111100110101101001010101001000010	e797bae68ea9e6b4aa42
UHC	痺掩洪B	11011101111101101110010111110011111110111111001101000010	ddf6e5f3fbf342

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)