Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	◇??ダ?嘔	100000011001111000111111001111111000001101011111001111111001101001110001	819e3f3f835f3f9a71
EUC-JP	◇??ダ?嘔	101000011111111000111111001111111010010111000000001111111101001111010010	a1fe3f3fa5c03fd3d2
UTF-8	◇룶卽ダ룶嘔	111000101001011110000111111010111010001110110110111001011000110110111101111000111000001110000000111010111010001110110110111001011001100010010100	e29787eba3b6e58dbde38380eba3b6e59894
UHC	◇룶卽ダ룶嘔	101000011101111010001111101010111111000111101101101010111100000010001111101010111100111110100101	a1de8fabf1edabc08fabcfa5

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)