Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	赤紗飛闇	1001000011010100100011101101000110010100111100101000100011000101	90d48ed194f288c5
EUC-JP	赤紗飛闇	1100000011010110101111001101001111001000111101001011000011000111	c0d6bcd3c8f4b0c7
UTF-8	赤紗飛闇	111010001011010110100100111001111011010010010111111010011010001110011011111010011001011110000111	e8b5a4e7b497e9a39be99787
UHC	赤紗飛闇	1110111011100101110111101110100111011110101010111110010011100001	eee5dee9deabe4e1

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)