Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	伍?１節	10001100110111100011111110000010010100001001000011011111	8cde3f825090df
EUC-JP	伍?１節	10111000111000000011111110100011101100011100000011100001	b8e03fa3b1c0e1
UTF-8	伍섇１節	111001001011110010001101111011001000010010000111111011111011110010010001111001111010111110000000	e4bc8dec8487efbc91e7af80
UHC	伍섇１節	1110011111101010100110001110010110100011101100011110111110111101	e7ea98e5a3b1efbd

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)