Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	菴岩坤綵	1110010010111101100010101110001010001101101000111110001101011100	e4bd8ae28da3e35c
EUC-JP	菴岩坤綵	1110100010111111101101001110010010111010101001011110010110111101	e8bfb4e4baa5e5bd
UTF-8	菴岩坤綵	111010001000111110110100111001011011001010101001111001011001110110100100111001111011011010110101	e88fb4e5b2a9e59da4e7b6b5
UHC	菴岩坤綵	1110010011100000111001001101101111001101110111101111001111110111	e4e0e4dbcddef3f7

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)