Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??×	001111110011111111010111	3f3fd7
SJIS-WIN	俑?×	1001100011011010001111111000000101111110	98da3f817e
EUC-JP	俑?×	1101000011011100001111111010000111011111	d0dc3fa1df
UTF-8	俑앸×	1110010010111111100100011110110010010101101110001100001110010111	e4bf91ec95b8c397
UHC	俑앸×	111010011011010110011101111010111010000110111111	e9b59deba1bf

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)