Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??WD??WD^	001111110011111101010111010001000011111100111111010101110100010001011110	3f3f57443f3f57445e
SJIS-WIN	禎?WD禎?WD^	1001001011110101001111110101011101000100100100101111010100111111010101110100010001011110	92f53f574492f53f57445e
EUC-JP	禎?WD禎?WD^	1100010011110111001111110101011101000100110001001111011100111111010101110100010001011110	c4f73f5744c4f73f57445e
UTF-8	禎렓WD禎렓WD^	1110011110100110100011101110101110100000100100110101011101000100111001111010011010001110111010111010000010010011010101110100010001011110	e7a68eeba0935744e7a68eeba09357445e
UHC	禎렓WD禎렓WD^	11101111111011101000111010101000010101110100010011101111111011101000111010101000010101110100010001011110	efee8ea85744efee8ea857445e

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)