Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	汀???晨?	1001001011110011001111110011111100111111100111011110110100111111	92f33f3f3f9ded3f
EUC-JP	汀???晨?	1100010011110101001111110011111100111111110110101110111100111111	c4f53f3f3fdaef3f
UTF-8	汀뀁렲렔晨챔	111001101011000110000000111010111000000010000001111010111010000010110010111010111010000010010100111001101001100110101000111011001011000110010100	e6b180eb8081eba0b2eba094e699a8ecb194
UHC	汀뀁렲렔晨챔	111011111110001010110010111011001000111010111111100011101010100111100011111001111100001110101000	efe2b2ec8ebf8ea9e3e7c3a8

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)