Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	蕭私坤茵決	11100101010010101000111010000100100011011010001111100100100111111000110010001000	e54a8e848da3e49f8c88
EUC-JP	蕭私坤茵決	11101001101010111011101111100100101110101010010111101000101000011011011111101000	e9abbbe4baa5e8a1b7e8
UTF-8	蕭私坤茵決	111010001001010110101101111001111010011110000001111001011001110110100100111010001000110010110101111001101011000110111010	e895ade7a781e59da4e88cb5e6b1ba
UHC	蕭私坤茵決	11100001110010111101111011100111110011011101111011101100111000001100110010111101	e1cbdee7cddeece0ccbd

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)