Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????BF	001111110011111100111111001111110100001001000110	3f3f3f3f4246
SJIS-WIN	ﾂ但ﾂ歎BF	1100001010010010010000011100001010010010010101100100001001000110	c29241c292564246
EUC-JP	ﾂ但ﾂ歎BF	10001110110000101100001110100010100011101100001011000011101101110100001001000110	8ec2c3a28ec2c3b74246
UTF-8	ﾂ但ﾂ歎BF	1110111110111110100000101110010010111101100001101110111110111110100000101110011010101101100011100100001001000110	efbe82e4bd86efbe82e6ad8e4246
UHC	?但?歎BF	0011111111010011101000110011111111110111101001110100001001000110	3fd3a33ff7a74246

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)