Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???B	00111111001111110011111101000010	3f3f3f42
SJIS-WIN	羹醇十B	11100011101110111000111110000110100011110101110001000010	e3bb8f868f5c42
EUC-JP	羹醇十B	11100110101111011011110111100110101111011011110101000010	e6bdbde6bdbd42
UTF-8	羹醇十B	11100111101111101011100111101001100001101000011111100101100011011000000101000010	e7beb9e98687e58d8142
UHC	羹醇十B	11001011110110001110001011110101111001001010100001000010	cbd8e2f5e4a842

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)