Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???C	00111111001111110011111101000011	3f3f3f43
SJIS-WIN	闢芽次C	11101000100100111000100111101000100011101001111101000011	e89389e88e9f43
EUC-JP	闢芽次C	11101111111100111011001011101010101111001010000101000011	eff3b2eabca143
UTF-8	闢芽次C	11101001100101111010001011101000100010101011110111100110101011001010000101000011	e997a2e88abde6aca143
UHC	闢芽次C	11011100101000111110010010110100111100111010110101000011	dca3e4b4f3ad43

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)