Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???????	00111111001111110011111100111111001111110011111100111111	3f3f3f3f3f3f3f
SJIS-WIN	ｼｯ跿ｼｷ踐	11110010111001001011110010101111111001101111001110111100101101111110011011110110	f2e4bcafe6f3bcb7e6f6
EUC-JP	?ｼｯ跿ｼｷ踐	00111111100011101011110010001110101011111110110011110101100011101011110010001110101101111110110011111000	3f8ebc8eafecf58ebc8eb7ecf8
UTF-8	ｼｯ跿ｼｷ踐	111011101000100010011011111011111011110110111100111011111011110110101111111010001011011110111111111011111011110110111100111011111011110110110111111010001011100010010000	ee889befbdbcefbdafe8b7bfefbdbcefbdb7e8b890
UHC	??????踐	0011111100111111001111110011111100111111001111111111010011000010	3f3f3f3f3f3ff4c2

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)