Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	薰ｯ迯三	11111011100111101010111111100111100011011000111001001111	fb9eafe78d8e4f
EUC-JP	?ｯ迯三	00111111100011101010111111101101111011011011101110110000	3f8eafededbbb0
UTF-8	薰ｯ迯三	111010001001011010110000111011111011110110101111111010001011111110101111111001001011100010001001	e896b0efbdafe8bfafe4b889
UHC	薰??三	111111011011100100111111001111111101111110110010	fdb93f3fdfb2

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)