Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	?紗飛韻	00111111100011101101000110010100111100101000100101000011	3f8ed194f28943
EUC-JP	泂紗飛韻	100011111100011011110110101111001101001111001000111101001011000110100100	8fc6f6bcd3c8f4b1a4
UTF-8	泂紗飛韻	111001101011001110000010111001111011010010010111111010011010001110011011111010011001111110111011	e6b382e7b497e9a39be99fbb
UHC	泂紗飛韻	1111101110100010110111101110100111011110101010111110101010100100	fba2dee9deabeaa4

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)