Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	髏泌炎驟欺	11101001100100001001010011100101100010011000101011101001100001011000101101011100	e99094e5898ae9858b5c
EUC-JP	髏泌炎驟欺	11110001111100001100100011100111101100011110101011110001111001011011010110111101	f1f0c8e7b1eaf1e5b5bd
UTF-8	髏泌炎驟欺	111010011010101110001111111001101011001110001100111001111000001010001110111010011010100110011111111001101010110010111010	e9ab8fe6b38ce7828ee9a99fe6acba
UHC	?泌炎驟欺	001111111111100110110010111001101111101011110110101011101101000110100111	3ff9b2e6faf6aed1a7

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)