Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	紗璽宍紗	1000111011010001100011101010001110001110101100111000111011010001	8ed18ea38eb38ed1
EUC-JP	紗璽宍紗	1011110011010011101111001010010110111100101101011011110011010011	bcd3bca5bcb5bcd3
UTF-8	紗璽宍紗	111001111011010010010111111001111001001010111101111001011010111010001101111001111011010010010111	e7b497e792bde5ae8de7b497
UHC	紗璽?紗	11011110111010011101111111011110001111111101111011101001	dee9dfde3fdee9

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)