Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	邉懃事髯ｰ隕	1110011110110011100111001110011110001110100101101110100110011001101100001110100010100110	e7b39ce78e96e999b0e8a6
EUC-JP	邉懃事髯ｰ隕	111011101011010111011000111010011011101111110110111100011111100110001110101100001111000010101000	eeb5d8e9bbf6f1f98eb0f0a8
UTF-8	邉懃事髯ｰ隕	111010011000001010001001111001101000011110000011111001001011101010001011111010011010101110101111111011111011110110110000111010011001101010010101	e98289e68783e4ba8be9abafefbdb0e99a95
UHC	?懃事??隕	001111111101000011000100110111101100000000111111001111111110101010100010	3fd0c4dec03f3feaa2

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)