Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	短造繰褻	1001001001011010100100011010001010001100010010101110010111110110	925a91a28c4ae5f6
EUC-JP	短造繰褻	1100001110111011110000101010010010110111101010111110101011111000	c3bbc2a4b7abeaf8
UTF-8	短造繰褻	111001111001111110101101111010011000000010100000111001111011100110110000111010001010010010111011	e79fade980a0e7b9b0e8a4bb
UHC	短造繰褻	1101001110101101111100001110001111110000110110111110000011100001	d3adf0e3f0dbe0e1

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)