Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	裙び危桝褊	11100101111000111000001011010001100010101110101110010110100100011110010111101101	e5e382d18aeb9691e5ed
EUC-JP	裙び危桝褊	11101010111001011010010011010011101101001110110111001011111100011110101011101111	eae5a4d3b4edcbf1eaef
UTF-8	裙び危桝褊	111010001010001110011001111000111000000110110011111001011000110110110001111001101010000110011101111010001010010010001010	e8a399e381b3e58db1e6a19de8a48a
UHC	裙び危??	1100111111011001101010101101001111101010110010110011111100111111	cfd9aad3eacb3f3f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)