Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	魍郁┳譚飮	11101001101100011000100011101000100001001011000111100110100111011001111101011010	e9b188e884b1e69d9f5a
EUC-JP	魍郁┳譚飮	11110010101100111011000011101010101010001011001111101011111111011101110110111011	f2b3b0eaa8b3ebfdddbb
UTF-8	魍郁┳譚飮	111010011010110110001101111010011000001110000001111000101001010010110011111010001010110110011010111010011010001110101110	e9ad8de98381e294b3e8ad9ae9a3ae
UHC	?郁┳譚飮	001111111110100111110100101001101011001111010011110010011110101111100110	3fe9f4a6b3d3c9ebe6

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)