Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???W???	00111111001111110011111101010111001111110011111100111111	3f3f3f573f3f3f
SJIS-WIN	ﾃδ｢Wﾃつ逆	11000011100000111100001010100010010101111100001110000010110000101000101101110100	c383c2a257c382c28b74
EUC-JP	ﾃδ｢Wﾃつ逆	10001110110000111010011011000100100011101010001001010111100011101100001110100100110001001011010111010101	8ec3a6c48ea2578ec3a4c4b5d5
UTF-8	ﾃδ｢Wﾃつ逆	111011111011111010000011110011101011010011101111101111011010001001010111111011111011111010000011111000111000000110100100111010011000000010000110	efbe83ceb4efbda257efbe83e381a4e98086
UHC	?δ?W?つ逆	00111111101001011110010000111111010101110011111110101010110001001110011010111101	3fa5e43f573faac4e6bd

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)