Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	髫懆侮嵭咎囿	111010011001101010011100111010001001010110001110111110101011001110011001111010011001101010011100	e99a9ce8958efab399e99a9c
EUC-JP	髫懆侮嵭咎囿	11110001111110101101100011101010110010011110111010001111101110111101111011010010111010111101001111111100	f1fad8eac9ee8fbbded2ebd3fc
UTF-8	髫懆侮嵭咎囿	111010011010101110101011111001101000011110000110111001001011111010101110111001011011010110101101111001011001001010001110111001011001101110111111	e9ababe68786e4beaee5b5ade5928ee59bbf
UHC	??侮?咎?	0011111100111111110110011011001000111111110011111010010000111111	3f3fd9b23fcfa43f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)