Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	厭レ?靭?	1000100101111101100000111000110000111111100100000111100000111111	897d838c3f90783f
EUC-JP	厭レ?靭?	1011000111011110101001011110110000111111101111111101100100111111	b1dea5ec3fbfd93f
UTF-8	厭レ뮁靭꿫	111001011000111010101101111000111000001110101100111010111010111010000001111010011001110110101101111010101011111110101011	e58eade383acebae81e99dadeabfab
UHC	厭レ뮁靭꿫	11100110111101001010101111101100100100101001000011101100111001011000010101101000	e6f4abec9290ece58568

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)