Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	壹驀?壹?漿	10011010111000111110100101111101001111111001101011100011001111111001111111110111	9ae3e97d3f9ae33f9ff7
EUC-JP	壹驀?壹?漿	11010100111001011111000111011110001111111101010011100101001111111101111011111001	d4e5f1de3fd4e53fdef9
UTF-8	壹驀읊壹렏漿	111001011010001110111001111010011010100110000000111011001001110110001010111001011010001110111001111010111010000010001111111001101011110010111111	e5a3b9e9a980ec9d8ae5a3b9eba08fe6bcbf
UHC	壹驀읊壹렏漿	111011001110110011011000111010011100000010111100111011001110110010001110101001011110110111101100	ececd8e9c0bcecec8ea5edec

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)