Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	巽坦他竪束	10010010010001101001001001010010100100011011110010010010010001111001000110101001	9246925291bc924791a9
EUC-JP	巽坦他竪束	11000011101001111100001110110011110000101011111011000011101010001100001010101011	c3a7c3b3c2bec3a8c2ab
UTF-8	巽坦他竪束	111001011011011110111101111001011001110110100110111001001011101110010110111001111010101110101010111001101001110110011111	e5b7bde59da6e4bb96e7abaae69d9f
UHC	巽坦他竪束	11100001110111101111011110100100111101101110001011100010101101011110000111010110	e1def7a4f6e2e2b5e1d6

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)