Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	??新??禹	0011111100111111100100000101011000111111001111111110001001011010	3f3f90563f3fe25a
EUC-JP	澐?新??禹	10001111110010001110100100111111101111111011011100111111001111111110001110111011	8fc8e93fbfb73f3fe3bb
UTF-8	澐렏新흡ㅀ禹	111001101011111010010000111010111010000010001111111001101001011010110000111011011001110110100001111000111000010110000000111001111010011010111001	e6be90eba08fe696b0ed9da1e38580e7a6b9
UHC	澐렏新흡ㅀ禹	111010011111101010001110101001011110001111100110110010001110110110100100101100001110100111100000	e9fa8ea5e3e6c8eda4b0e9e0

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)