Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	鋕室瑤雫竺	111110111101010010001110101110101110101010100010100011101011010011110001111000001000111010110001	fbd48ebaeaa28eb4f1e08eb1
EUC-JP	鋕室瑤雫?竺	100011111110010011000000101111001011110011110100101001001011110010110110001111111011110010110011	8fe4c0bcbcf4a4bcb63fbcb3
UTF-8	鋕室瑤雫竺	111010011000101110010101111001011010111010100100111001111001000110100100111010011001101110101011111011101000010110011011111001111010101110111010	e98b95e5aea4e791a4e99babee859be7abba
UHC	?室瑤??竺	001111111110001111111000111010001111110100111111001111111111010111100111	3fe3f8e8fd3f3ff5e7

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)