Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???	001111110011111100111111	3f3f3f
SJIS-WIN	菫卓槙	111001001011111110010001111011001001011010001010	e4bf91ec968a
EUC-JP	菫卓槙	111010001100000111000010111011101100101111101010	e8c1c2eecbea
UTF-8	菫卓槙	111010001000111110101011111001011000110110010011111001101010011110011001	e88fabe58d93e6a799
UHC	菫卓?	1101000011001011111101101111000100111111	d0cbf6f13f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)