Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	窪??伸捐俉	10001100010001010011111100111111100100000100110010011101011011111111101001100001	8c453f3f904c9d6ffa61
EUC-JP	窪??伸捐俉	1011011110100110001111110011111110111111101011011101100111010000100011111011000110111011	b7a63f3fbfadd9d08fb1bb
UTF-8	窪집歷伸捐俉	111001111010101010101010111011001010011110010001111011111010011010001100111001001011110010111000111001101000110110010000111001001011111110001001	e7aaaaeca791efa68ce4bcb8e68d90e4bf89
UHC	窪집歷伸捐俉	111010001100000111000001111111011110011010111000111000111101111111100110110010001110011111101011	e8c1c1fde6b8e3dfe6c8e7eb

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)