Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	?汗庭??紐	001111111000101010111110100100101110101100111111001111111001010101010010	3f8abe92eb3f3f9552
EUC-JP	?汗庭??紐	001111111011010011000000110001001110110100111111001111111100100110110011	3fb4c0c4ed3f3fc9b3
UTF-8	뤋汗庭쨵샘紐	111010111010010010001011111001101011000110010111111001011011101010101101111011001010100010110101111011001000001110011000111001111011010010010000	eba48be6b197e5baadeca8b5ec8398e7b490
UHC	뤋汗庭쨵샘紐	100011111011101111111001110100101110111111010100101001001000111110111011111110011101001011101111	8fbbf9d2efd4a48fbbf9d2ef

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)