Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???	001111110011111100111111	3f3f3f
SJIS-WIN	隕?治	1110100010100110001111111000111010100001	e8a63f8ea1
EUC-JP	隕?治	1111000010101000001111111011110010100011	f0a83fbca3
UTF-8	隕덜治	111010011001101010010101111010111000110110011100111001101011001010111011	e99a95eb8d9ce6b2bb
UHC	隕덜治	111010101010001010110100111110101111011010111101	eaa2b4faf6bd

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)