Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	煜?幸㎞	11111011010101010011111110001101010010111000011101110001	fb553f8d4b8771
EUC-JP	煜?幸?	10001111110010011111110000111111101110011010110000111111	8fc9fc3fb9ac3f
UTF-8	煜렎幸㎞	111001111000010110011100111010111010000010001110111001011011100110111000111000111000111010011110	e7859ceba08ee5b9b8e38e9e
UHC	煜렎幸㎞	1110100111110010100011101010010011111010101110011010011110110000	e9f28ea4fab9a7b0

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)