Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	ﾃつ催δ嘉	110000111000001011000010100011011100001110000011110000101000100111000011	c382c28dc383c289c3
EUC-JP	ﾃつ催δ嘉	10001110110000111010010011000100101110101100010110100110110001001011001011000101	8ec3a4c4bac5a6c4b2c5
UTF-8	ﾃつ催δ嘉	1110111110111110100000111110001110000001101001001110010110000010101011001100111010110100111001011001100010001001	efbe83e381a4e582acceb4e59889
UHC	?つ催δ嘉	001111111010101011000100111101011100101010100101111001001100101010101001	3faac4f5caa5e4caa9

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)