Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???BF	0011111100111111001111110100001001000110	3f3f3f4246
SJIS-WIN	釈章ｻBF	10001110110111111000111111001101101110110100001001000110	8edf8fcdbb4246
EUC-JP	釈章ｻBF	1011110011100001101111101100111110001110101110110100001001000110	bce1becf8ebb4246
UTF-8	釈章ｻBF	1110100110000111100010001110011110101011101000001110111110111101101110110100001001000110	e98788e7aba0efbdbb4246
UHC	?章?BF	001111111110110111110001001111110100001001000110	3fedf13f4246

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)