Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???rB	0011111100111111001111110111001001000010	3f3f3f7242
SJIS-WIN	蕭縁襲rB	1110010101001010100010011000111110001111010100000111001001000010	e54a898f8f507242
EUC-JP	蕭縁襲rB	1110100110101011101100011110111110111101101100010111001001000010	e9abb1efbdb17242
UTF-8	蕭縁襲rB	1110100010010101101011011110011110111000100000011110100010100101101100100111001001000010	e895ade7b881e8a5b27242
UHC	蕭?襲rB	11100001110010110011111111100011101010010111001001000010	e1cb3fe3a97242

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)