Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	å¶¹æ²»	111001011011011010111001111001101011001010111011	e5b6b9e6b2bb
SJIS-WIN	?¶????	00111111100000011111011100111111001111110011111100111111	3f81f73f3f3f3f
EUC-JP	å¶?æ??	1000111110101011101010011010001011111001001111111000111110101001110000010011111100111111	8faba9a2f93f8fa9c13f3f
UTF-8	å¶¹æ²»	110000111010010111000010101101101100001010111001110000111010011011000010101100101100001010111011	c3a5c2b6c2b9c3a6c2b2c2bb
UHC	?¶¹æ²?	00111111101000101101001010101001111101101010100110100001101010011111011100111111	3fa2d2a9f6a9a1a9f73f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)