Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????K	0011111100111111001111110011111101001011	3f3f3f3f4b
SJIS-WIN	篠蒔偲爾K	100011101100001010001110101010101000111011000011100011101010001001001011	8ec28eaa8ec38ea24b
EUC-JP	篠蒔偲爾K	101111001100010010111100101011001011110011000101101111001010010001001011	bcc4bcacbcc5bca44b
UTF-8	篠蒔偲爾K	11100111101011111010000011101000100100101001010011100101100000011011001011100111100010001011111001001011	e7afa0e89294e581b2e788be4b
UHC	篠蒔?爾K	1110000111000110111000111100100000111111111011001011001101001011	e1c6e3c83fecb34b

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)