Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????U	001111110011111100111111001111110011111101010101	3f3f3f3f3f55
SJIS-WIN	荵玲圈雎ｺU	11100100101110011001011111100110100110101001111111101000101100011011101001010101	e4b997e69a9fe8b1ba55
EUC-JP	荵玲圈雎ｺU	1110100010111011110011101110100011010100101000011111000010110011100011101011101001010101	e8bbcee8d4a1f0b38eba55
UTF-8	荵玲圈雎ｺU	11101000100011011011010111100111100011101011001011100101100111001000100011101001100110111000111011101111101111011011101001010101	e88db5e78eb2e59c88e99b8eefbdba55
UHC	?玲圈雎?U	001111111101011010111100110011111110101011101110110100010011111101010101	3fd6bccfeaeed13f55

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)