Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	霑ｹ隧菱	11101000101111111011100111101000101010011001010101001000	e8bfb9e8a99548
EUC-JP	霑ｹ隧菱	1111000011000001100011101011100111110000101010111100100110101001	f0c18eb9f0abc9a9
UTF-8	霑ｹ隧菱	111010011001110010010001111011111011110110111001111010011001101010100111111010001000111110110001	e99c91efbdb9e99aa7e88fb1
UHC	霑?隧菱	11101111110001010011111111100010110010101101011111010100	efc53fe2cad7d4

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)