Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	衒室赦爾車	11100101110010001000111010111010100011101100110110001110101000101000111011010100	e5c88eba8ecd8ea28ed4
EUC-JP	衒室赦爾車	11101010110010101011110010111100101111001100111110111100101001001011110011010110	eacabcbcbccfbca4bcd6
UTF-8	衒室赦爾車	111010001010000110010010111001011010111010100100111010001011010110100110111001111000100010111110111010001011101110001010	e8a192e5aea4e8b5a6e788bee8bb8a
UHC	衒室赦爾車	11111010111001011110001111111000110111101111010111101100101100111111001110110011	fae5e3f8def5ecb3f3b3

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)