Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????B	0011111100111111001111110011111101000010	3f3f3f3f42
SJIS-WIN	舒潛舒潛B	100110001010111011100000010010011001100010101110111000000100100101000010	98aee04998aee04942
EUC-JP	舒潛舒潛B	110100001011000011011111101010101101000010110000110111111010101001000010	d0b0dfaad0b0dfaa42
UTF-8	舒潛舒潛B	11101000100010001001001011100110101111011001101111101000100010001001001011100110101111011001101101000010	e88892e6bd9be88892e6bd9b42
UHC	舒潛舒潛B	111000001010001011101101110101101110000010100010111011011101011001000010	e0a2edd6e0a2edd642

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)