Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????B	00111111001111110011111100111111001111110011111101000010	3f3f3f3f3f3f42
SJIS-WIN	昕ﾝ｢昕ﾝ｢B	111110101100111111011101101000101111101011001111110111011010001001000010	facfdda2facfdda242
EUC-JP	昕ﾝ｢昕ﾝ｢B	100011111100000111111100100011101101110110001110101000101000111111000001111111001000111011011101100011101010001001000010	8fc1fc8edd8ea28fc1fc8edd8ea242
UTF-8	昕ﾝ｢昕ﾝ｢B	11100110100110001001010111101111101111101001110111101111101111011010001011100110100110001001010111101111101111101001110111101111101111011010001001000010	e69895efbe9defbda2e69895efbe9defbda242
UHC	昕??昕??B	111111011101101000111111001111111111110111011010001111110011111101000010	fdda3f3ffdda3f3f42

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)