Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	邂?憶??太	111001111010111000111111100010011010111100111111001111111001000110111110	e7ae3f89af3f3f91be
EUC-JP	邂?憶??太	111011101011000000111111101100101011000100111111001111111100001011000000	eeb03fb2b13f3fc2c0
UTF-8	邂렖憶렔뤈太	111010011000001010000010111010111010000010010110111001101000011010110110111010111010000010010100111010111010010010001000111001011010010010101010	e98282eba096e686b6eba094eba488e5a4aa
UHC	邂렖憶렔뤈太	111110101011001110001110101010111110010111100011100011101010100110001111101110001111011110111100	fab38eabe5e38ea98fb8f7bc

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)