Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	鈿ｫ蜿門ｴ玖	11100111111011011010101111100101100011111001011011100101101101001000101111101000	e7edabe58f96e5b48be8
EUC-JP	鈿ｫ蜿門ｴ玖	111011101110111110001110101010111110100111101111110011001110011110001110101101001011011011101010	eeef8eabe9efcce78eb4b6ea
UTF-8	鈿ｫ蜿門ｴ玖	111010011000100010111111111011111011110110101011111010001001110010111111111010011001011010000000111011111011110110110100111001111000111010010110	e988bfefbdabe89cbfe99680efbdb4e78e96
UHC	鈿??門?玖	111011111010111100111111001111111101101010100110001111111100111110111000	efaf3f3fdaa63fcfb8

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)