Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	語??耀??	1000110011101010001111110011111110010111011100110011111100111111	8cea3f3f97733f3f
EUC-JP	語??耀??	1011100011101100001111110011111111001101110101000011111100111111	b8ec3f3fcdd43f3f
UTF-8	語뤺뾹耀붿슌	111010001010101010011110111010111010010010111010111010111011111010111001111010001000000010000000111010111011011010111111111011001000101010001100	e8aa9eeba4baebbeb9e88080ebb6bfec8a8c
UHC	語뤺뾹耀붿슌	111001011101111010001111111010001001011110000001111010011010010110010100111011001001101010011100	e5de8fe89781e9a594ec9a9c

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)