Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	仰??煙??	1000101111000010001111110011111110001001100011000011111100111111	8bc23f3f898c3f3f
EUC-JP	仰??煙??	1011011011000100001111110011111110110001111011000011111100111111	b6c43f3fb1ec3f3f
UTF-8	仰롘렪煙롘렪	111001001011101110110000111010111010000110011000111010111010000010101010111001111000010110011001111010111010000110011000111010111010000010101010	e4bbb0eba198eba0aae78599eba198eba0aa
UHC	仰롘렪煙롘렪	111001001110011010001110110111001000111010111000111001101101010110001110110111001000111010111000	e4e68edc8eb8e6d58edc8eb8

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)