Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????H	00111111001111110011111100111111001111110011111101001000	3f3f3f3f3f3f48
SJIS-WIN	驪暦ｾ費ｽｼH	11101001100010111001011111101111101111101001010011101111101111011011110001001000	e98b97efbe94efbdbc48
EUC-JP	驪暦ｾ費ｽｼH	11110001111010111100111011110001100011101011111011001000111100011000111010111101100011101011110001001000	f1ebcef18ebec8f18ebd8ebc48
UTF-8	驪暦ｾ費ｽｼH	11101001101010011010101011100110100110101010011011101111101111011011111011101000101100101011101111101111101111011011110111101111101111011011110001001000	e9a9aae69aa6efbdbee8b2bbefbdbdefbdbc48
UHC	驪??費??H	110101011111000100111111001111111101111010101000001111110011111101001000	d5f13f3fdea83f3f48

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)