Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??^z??^zB	001111110011111101011110011110100011111100111111010111100111101001000010	3f3f5e7a3f3f5e7a42
SJIS-WIN	證?^z證?^zB	1110011010011010001111110101111001111010111001101001101000111111010111100111101001000010	e69a3f5e7ae69a3f5e7a42
EUC-JP	證?^z證?^zB	1110101111111010001111110101111001111010111010111111101000111111010111100111101001000010	ebfa3f5e7aebfa3f5e7a42
UTF-8	證렓^z證렓^zB	1110100010101101100010011110101110100000100100110101111001111010111010001010110110001001111010111010000010010011010111100111101001000010	e8ad89eba0935e7ae8ad89eba0935e7a42
UHC	證렓^z證렓^zB	11110001111110111000111010101000010111100111101011110001111110111000111010101000010111100111101001000010	f1fb8ea85e7af1fb8ea85e7a42

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)