Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???????	00111111001111110011111100111111001111110011111100111111	3f3f3f3f3f3f3f
SJIS-WIN	彗??炯①?壯	1001110001100001001111110011111111100000011101101000011101000000001111111001101011100001	9c613f3fe07687403f9ae1
EUC-JP	彗??炯??壯	11010111110000100011111100111111110111111101011100111111001111111101010011100011	d7c23f3fdfd73f3fd4e3
UTF-8	彗륃맆炯①츕壯	111001011011110110010111111010111010010110000011111010111010011110000110111001111000001010101111111000101001000110100000111011001011100010010101111001011010001110101111	e5bd97eba583eba786e782afe291a0ecb895e5a3af
UHC	彗륃맆炯①츕壯	1111101110110010100011111110111010010000101000001111101110100110101010001110011110101110100011111110110111100000	fbb28fee90a0fba6a8e7ae8fede0

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)