Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??n??nB	00111111001111110110111000111111001111110110111001000010	3f3f6e3f3f6e42
SJIS-WIN	脱炭n脱炭nB	1001001001000101100100100101100101101110100100100100010110010010010110010110111001000010	924592596e924592596e42
EUC-JP	脱炭n脱炭nB	1100001110100110110000111011101001101110110000111010011011000011101110100110111001000010	c3a6c3ba6ec3a6c3ba6e42
UTF-8	脱炭n脱炭nB	111010001000010010110001111001111000001010101101011011101110100010000100101100011110011110000010101011010110111001000010	e884b1e782ad6ee884b1e782ad6e42
UHC	?炭n?炭nB	001111111111011110101001011011100011111111110111101010010110111001000010	3ff7a96e3ff7a96e42

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)