Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????A??	00111111001111110011111100111111010000010011111100111111	3f3f3f3f413f3f
SJIS-WIN	鬆､螳､A鬆ｸ	11101001101000001010010011100101101011101010010001000001111010011010000010111000	e9a0a4e5aea441e9a0b8
EUC-JP	鬆､螳､A鬆ｸ	11110010101000101000111010100100111010101011000010001110101001000100000111110010101000101000111010111000	f2a28ea4eab08ea441f2a28eb8
UTF-8	鬆､螳､A鬆ｸ	11101001101011001000011011101111101111011010010011101000100111101011001111101111101111011010010001000001111010011010110010000110111011111011110110111000	e9ac86efbda4e89eb3efbda441e9ac86efbdb8
UHC	??螳?A??	0011111100111111110100111101100100111111010000010011111100111111	3f3fd3d93f413f3f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)