Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	淏ｷ螳削罘蠑	1111101101000010101101111110010110101110100011011110110111100011101001111110010110111100	fb42b7e5ae8dede3a7e5bc
EUC-JP	淏ｷ螳削罘蠑	10001111110001111101100110001110101101111110101010110000101110101110111111100110101010011110101010111110	8fc7d98eb7eab0baefe6a9eabe
UTF-8	淏ｷ螳削罘蠑	111001101011011110001111111011111011110110110111111010001001111010110011111001011000100110001010111001111011110110011000111010001010000010010001	e6b78fefbdb7e89eb3e5898ae7bd98e8a091
UHC	淏?螳削??	111110111100100000111111110100111101100111011110111110110011111100111111	fbc83fd3d9defb3f3f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)