Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	堤???止?	1001001011100111001111110011111100111111100011100111111000111111	92e73f3f3f8e7e3f
EUC-JP	堤???止?	1100010011101001001111110011111100111111101110111101111100111111	c4e93f3f3fbbdf3f
UTF-8	堤비렰렑止렩	111001011010000010100100111010111011100110000100111010111010000010110000111010111010000010010001111001101010110110100010111010111010000010101001	e5a0a4ebb984eba0b0eba091e6ada2eba0a9
UHC	堤비렰렑止렩	111100001010011110111010111100011000111010111101100011101010011011110010101011011000111010110111	f0a7baf18ebd8ea6f2ad8eb7

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)