Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	紆?小往	11100010111111000011111110001111101011001000100110011101	e2fc3f8fac899d
EUC-JP	紆?小往	11100100111111100011111110111110101011101011000111111101	e4fe3fbeaeb1fd
UTF-8	紆숣小往	111001111011010010000110111011001000100010100011111001011011000010001111111001011011111010000000	e7b486ec88a3e5b08fe5be80
UHC	紆숣小往	1110100111100001100110011111111011100001101100111110100011011001	e9e199fee1b3e8d9

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)