Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????A	0011111100111111001111110011111101000001	3f3f3f3f41
SJIS-WIN	湿芝湿疾A	100011101011110010001110110001011000111010111100100011101011111001000001	8ebc8ec58ebc8ebe41
EUC-JP	湿芝湿疾A	101111001011111010111100110001111011110010111110101111001100000001000001	bcbebcc7bcbebcc041
UTF-8	湿芝湿疾A	11100110101110011011111111101000100010101001110111100110101110011011111111100111100101101011111001000001	e6b9bfe88a9de6b9bfe796be41
UHC	?芝?疾A	00111111111100101011100100111111111100101111000001000001	3ff2b93ff2f041

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)