Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	肄睡⊂苡	1110001111100101100100001000011110000001101111001110010010001111	e3e5908781bce48f
EUC-JP	肄睡⊂苡	1110011011100111101111111110011110100010101111101110011111101111	e6e7bfe7a2bee7ef
UTF-8	肄睡⊂苡	111010001000001010000100111001111001110110100001111000101000101010000010111010001000101110100001	e88284e79da1e28a82e88ba1
UHC	肄睡⊂苡	1110110010111101111000101011001010100001111110001110110010111110	ecbde2b2a1f8ecbe

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)