Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????P	0011111100111111001111110011111101010000	3f3f3f3f50
SJIS-WIN	賈豺賈滸P	111001101100100111100110101101111110011011001001100111111111010101010000	e6c9e6b7e6c99ff550
EUC-JP	賈豺賈滸P	111011001100101111101100101110011110110011001011110111101111011101010000	eccbecb9eccbdef750
UTF-8	賈豺賈滸P	11101000101100111000100011101000101100011011101011101000101100111000100011100110101110111011100001010000	e8b388e8b1bae8b388e6bbb850
UHC	賈豺賈滸P	110010101011100111100011110011111100101010111001111110111100101001010000	cab9e3cfcab9fbca50

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)