Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????C	00111111001111110011111100111111001111110011111101000011	3f3f3f3f3f3f43
SJIS-WIN	?逝??逝?C	001111111001000011000000001111110011111110010000110000000011111101000011	3f90c03f3f90c03f43
EUC-JP	?逝??逝?C	001111111100000011000010001111110011111111000000110000100011111101000011	3fc0c23f3fc0c23f43
UTF-8	샬逝셰샬逝셰C	11101100100000111010110011101001100000001001110111101100100001011011000011101100100000111010110011101001100000001001110111101100100001011011000001000011	ec83ace9809dec85b0ec83ace9809dec85b043
UHC	샬逝셰샬逝셰C	10111100101000111110000010100110101111001100111010111100101000111110000010100110101111001100111001000011	bca3e0a6bccebca3e0a6bcce43

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)