Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????B	0011111100111111001111110011111101000010	3f3f3f3f42
SJIS-WIN	鋓識鋓識B	111110111101011010001110101011111111101111010110100011101010111101000010	fbd68eaffbd68eaf42
EUC-JP	鋓識鋓識B	1000111111100100101111111011110010110001100011111110010010111111101111001011000101000010	8fe4bfbcb18fe4bfbcb142
UTF-8	鋓識鋓識B	11101001100010111001001111101000101011011001100011101001100010111001001111101000101011011001100001000010	e98b93e8ad98e98b93e8ad9842
UHC	?識?識B	00111111111000111101101100111111111000111101101101000010	3fe3db3fe3db42

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)