Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	爾霖識淲痔	111100101010111010001110101000101110100011000001100011101010111111111011010001001000111010100100	f2ae8ea2e8c18eaffb448ea4
EUC-JP	?爾霖識?痔	00111111101111001010010011110000110000111011110010110001001111111011110010100110	3fbca4f0c3bcb13fbca6
UTF-8	爾霖識淲痔	111011101000011110100101111001111000100010111110111010011001110010010110111010001010110110011000111001101011011110110010111001111001011110010100	ee87a5e788bee99c96e8ad98e6b7b2e79794
UHC	?爾霖識?痔	00111111111011001011001111010111111111011110001111011011001111111111011011000000	3fecb3d7fde3db3ff6c0

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)