Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	拙??葛?界	100100001101100100111111001111111000101010001011001111111000101001000101	90d93f3f8a8b3f8a45
EUC-JP	拙??葛?界	110000001101101100111111001111111011001111101011001111111011001110100110	c0db3f3fb3eb3fb3a6
UTF-8	拙흙렒葛렜界	111001101000101110011001111011011001110110011001111010111010000010010010111010001001000110011011111010111010000010011100111001111001010110001100	e68b99ed9d99eba092e8919beba09ce7958c
UHC	拙흙렒葛렜界	111100001111000011001000111010111000111010100111110010101110011110001110101011101100110110100011	f0f0c8eb8ea7cae78eaecda3

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)