Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	汚х┴熱?姚	1000100110011000100001001000011110000100101010001001010001001101001111111001101101001100	8998848784a8944d3f9b4c
EUC-JP	汚х┴熱?姚	1011000111111000101001111110011110101000101010101100011110101110001111111101010110101101	b1f8a7e7a8aac7ae3fd5ad
UTF-8	汚х┴熱풞姚	1110011010110001100110101101000110000101111000101001010010110100111001111000011010110001111011011001001010011110111001011010011110011010	e6b19ad185e294b4e786b1ed929ee5a79a
UHC	汚х┴熱풞姚	111001111111110110101100111001111010011010101010111001101111000010111111010000011110100011101110	e7fdace7a6aae6f0bf41e8ee

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)