Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	螢ｬ峵犠	11100101101000111010110011111010101011101000101101011101	e5a3acfaae8b5d
EUC-JP	螢ｬ?犠	11101010101001011000111010101100001111111011010110111110	eaa58eac3fb5be
UTF-8	螢ｬ峵犠	111010001001111010100010111011111011110110101100111001011011001110110101111001111000101010100000	e89ea2efbdace5b3b5e78aa0
UHC	螢???	1111101110101011001111110011111100111111	fbab3f3f3f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)