Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	厭ル?唯	10001001011111011000001110001011001111111001011101000010	897d838b3f9742
EUC-JP	厭ル?唯	10110001110111101010010111101011001111111100110110100011	b1dea5eb3fcda3
UTF-8	厭ル떵唯	111001011000111010101101111000111000001110101011111010111001011010110101111001011001010010101111	e58eade383abeb96b5e594af
UHC	厭ル떵唯	1110011011110100101010111110101110110110101110101110101011100110	e6f4abebb6baeae6

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)