Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???U	00111111001111110011111101010101	3f3f3f55
SJIS-WIN	霍護┳U	11101000101101111000110011101100100001001011000101010101	e8b78cec84b155
EUC-JP	霍護┳U	11110000101110011011100011101110101010001011001101010101	f0b9b8eea8b355
UTF-8	霍護┳U	11101001100111001000110111101000101011011011011111100010100101001011001101010101	e99c8de8adb7e294b355
UHC	?護┳U	001111111111101111011110101001101011001101010101	3ffbdea6b355

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)