Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???t	00111111001111110011111101110100	3f3f3f74
SJIS-WIN	粱沿畿t	11100010111010111000100110001000100010110100010101110100	e2eb89888b4574
EUC-JP	粱沿畿t	11100100111011011011000111101000101101011010011001110100	e4edb1e8b5a674
UTF-8	粱沿畿t	11100111101100101011000111100110101100101011111111100111100101011011111101110100	e7b2b1e6b2bfe795bf74
UHC	粱沿畿t	11010101110111001110011011001101110100011011001001110100	d5dce6cdd1b274

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)