Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???	001111110011111100111111	3f3f3f
SJIS-WIN	婁芍凌	100110000100101111100100100010011001011110111101	984be48997bd
EUC-JP	婁芍凌	110011111010110011100111111010011100111010111111	cface7e9cebf
UTF-8	婁芍凌	111001011010100110000001111010001000101010001101111001011000011110001100	e5a981e88a8de5878c
UHC	婁芍凌	110101111010010111101101110010111101011111010000	d7a5edcbd7d0

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)