Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??G??R	001111110011111101000111001111110011111101010010	3f3f473f3f52
SJIS-WIN	貳貽G貳貽R	11100110110001101110011011000100010001111110011011000110111001101100010001010010	e6c6e6c447e6c6e6c452
EUC-JP	貳貽G貳貽R	11101100110010001110110011000110010001111110110011001000111011001100011001010010	ecc8ecc647ecc8ecc652
UTF-8	貳貽G貳貽R	1110100010110010101100111110100010110010101111010100011111101000101100101011001111101000101100101011110101010010	e8b2b3e8b2bd47e8b2b3e8b2bd52
UHC	貳貽G貳貽R	11101100110000111110110011000010010001111110110011000011111011001100001001010010	ecc3ecc247ecc3ecc252

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)