Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	擁??奄??	1001011101101001001111110011111110001001100000100011111100111111	97693f3f89823f3f
EUC-JP	擁??奄??	1100110111001010001111110011111110110001111000100011111100111111	cdca3f3fb1e23f3f
UTF-8	擁곩즺奄닷캍	111001101001001110000001111010101011001110101001111011001010011010111010111001011010010110000100111010111000101110110111111011001011101010001101	e69381eab3a9eca6bae5a584eb8bb7ecba8d
UHC	擁곩즺奄닷캍	111010001011011010000001111001011010001110001100111001011111001010110100111001011010111110011000	e8b681e5a38ce5f2b4e5af98

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)