Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	逕夲ｽ嬢梓鮠	1110011110010100100110101110111110111101100011111110110010001000101100101110100110111100	e7949aefbd8fec88b2e9bc
EUC-JP	逕夲ｽ嬢梓鮠	111011011111010011010100111100011000111010111101101111101110111010110000101101001111001010111110	edf4d4f18ebdbeeeb0b4f2be
UTF-8	逕夲ｽ嬢梓鮠	111010011000000010010101111001011010010010110010111011111011110110111101111001011010110010100010111001101010001010010011111010011010111010100000	e98095e5a4b2efbdbde5aca2e6a293e9aea0
UHC	逕???梓?	1100110011101111001111110011111100111111111011101010100100111111	ccef3f3f3feea93f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)