Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	???業??	00111111001111110011111110001011110001100011111100111111	3f3f3f8bc63f3f
EUC-JP	蔣??業??	100011111101100110110110001111110011111110110110110010000011111100111111	8fd9b63f3fb6c83f3f
UTF-8	蔣붹삤業삶댉	111010001001010010100011111010111011011010111001111011001000001010100100111001101010010110101101111011001000001010110110111010111000110010001001	e894a3ebb6b9ec82a4e6a5adec82b6eb8c89
UHC	蔣붹삤業삶댉	111011011111100010010100111001101001100010100100111001011111011010111011111011101000100010110010	edf894e698a4e5f6bbee88b2

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)