Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	?咀??	0011111110011001111100000011111100111111	3f99f03f3f
EUC-JP	棅咀?棅	100011111100001111111011110100101111001000111111100011111100001111111011	8fc3fbd2f23f8fc3fb
UTF-8	棅咀랖棅	111001101010001110000101111001011001001010000000111010111001111010010110111001101010001110000101	e6a385e59280eb9e96e6a385
UHC	棅咀랖棅	1101110010111000111011101011101010110110111111011101110010111000	dcb8eebab6fddcb8

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)