Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????B	0011111100111111001111110011111101000010	3f3f3f3f42
SJIS-WIN	鴫示鴫示B	100011101011000010001110101001101000111010110000100011101010011001000010	8eb08ea68eb08ea642
EUC-JP	鴫示鴫示B	101111001011001010111100101010001011110010110010101111001010100001000010	bcb2bca8bcb2bca842
UTF-8	鴫示鴫示B	11101001101101001010101111100111101001001011101011101001101101001010101111100111101001001011101001000010	e9b4abe7a4bae9b4abe7a4ba42
UHC	?示?示B	00111111111000111100011000111111111000111100011001000010	3fe3c63fe3c642

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)