Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	陋呷棗逅ｵ陋	1110100010011011100110011110110010011110101001011110011110010000101101011110100010011011	e89b99ec9ea5e790b5e89b
EUC-JP	陋呷棗逅ｵ陋	111011111111101111010010111011101101110010100111111011011111000010001110101101011110111111111011	effbd2eedca7edf08eb5effb
UTF-8	陋呷棗逅ｵ陋	111010011001100110001011111001011001000110110111111001101010001110010111111010011000000010000101111011111011110110110101111010011001100110001011	e9998be591b7e6a397e98085efbdb5e9998b
UHC	陋?棗逅?陋	11010111101100000011111111110000110010101111110110110001001111111101011110110000	d7b03ff0cafdb13fd7b0

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)