Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	鴪宍裙而昌ｯ	1110100111110000100011101011001111100101111000111000111010100111100011111011100110101111	e9f08eb3e5e38ea78fb9af
EUC-JP	鴪宍裙而昌ｯ	111100101111001010111100101101011110101011100101101111001010100110111110101110111000111010101111	f2f2bcb5eae5bca9bebb8eaf
UTF-8	鴪宍裙而昌ｯ	111010011011010010101010111001011010111010001101111010001010001110011001111010001000000010001100111001101001100010001100111011111011110110101111	e9b4aae5ae8de8a399e8808ce6988cefbdaf
UHC	??裙而昌?	001111110011111111001111110110011110110010111011111100111110001100111111	3f3fcfd9ecbbf3e33f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)