Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	郁??紗?	10001000111010000011111100111111100011101101000100111111	88e83f3f8ed13f
EUC-JP	郁?邕紗?	101100001110101000111111100011111110000111101101101111001101001100111111	b0ea3f8fe1edbcd33f
UTF-8	郁렞邕紗캥	111010011000001110000001111010111010000010011110111010011000001010010101111001111011010010010111111011001011101010100101	e98381eba09ee98295e7b497ecbaa5
UHC	郁렞邕紗캥	11101001111101001000111010101111111010001011101111011110111010011100010010111011	e9f48eafe8bbdee9c4bb

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)