Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	闌夜ｧ募ｾ摘	11101000100011001001011011101001101001111001010111100101101111101001001101000101	e88c96e9a795e5be9345
EUC-JP	闌夜ｧ募ｾ摘	111011111110110011001100111010111000111010100111110010101110011110001110101111101100010110100110	efeccceb8ea7cae78ebec5a6
UTF-8	闌夜ｧ募ｾ摘	111010011001011110001100111001011010010010011100111011111011110110100111111001011000101110011111111011111011110110111110111001101001000110011000	e9978ce5a49cefbda7e58b9fefbdbee69198
UHC	?夜?募?摘	001111111110010110101000001111111101100110110100001111111110111011010111	3fe5a83fd9b43feed7

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)