Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???S?	0011111100111111001111110101001100111111	3f3f3f533f
SJIS-WIN	?孀數S杉	0011111110011011011100011001110111001001010100111001000010011001	3f9b719dc9539099
EUC-JP	?孀數S杉	0011111111010101110100101101101011001011010100111011111111111001	3fd5d2dacb53bff9
UTF-8	쑫孀數S杉	11101100100100011010101111100101101011011000000011100110100101011011100001010011111001101001110110001001	ec91abe5ad80e695b853e69d89
UHC	쑫孀數S杉	100111001100011111011111110001011110001010100110010100111101111110110100	9cc7dfc5e2a653dfb4

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)