Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	籖画燦膠	1110001011011101100010011110011010001110010101111110010001010000	e2dd89e68e57e450
EUC-JP	籖画燦膠	1110010011011111101100101110100010111011101110001110011110110001	e4dfb2e8bbb8e7b1
UTF-8	籖画燦膠	111001111011000110010110111001111001010010111011111001111000011110100110111010001000011010100000	e7b196e794bbe787a6e886a0
UHC	??燦膠	001111110011111111110011101111101100111011101111	3f3ff3beceef

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)