Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??z??zB	00111111001111110111101000111111001111110111101001000010	3f3f7a3f3f7a42
SJIS-WIN	蝨ｦz蝨ｦzB	111001011001110010100110011110101110010110011100101001100111101001000010	e59ca67ae59ca67a42
EUC-JP	蝨ｦz蝨ｦzB	1110100111111100100011101010011001111010111010011111110010001110101001100111101001000010	e9fc8ea67ae9fc8ea67a42
UTF-8	蝨ｦz蝨ｦzB	111010001001110110101000111011111011110110100110011110101110100010011101101010001110111110111101101001100111101001000010	e89da8efbda67ae89da8efbda67a42
UHC	蝨?z蝨?zB	111000111010010000111111011110101110001110100100001111110111101001000010	e3a43f7ae3a43f7a42

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)