Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	亦??誼?┸	100101101001001000111111001111111000101101100010001111111000010010111101	96923f3f8b623f84bd
EUC-JP	亦??誼?┸	110010111111001000111111001111111011010111000011001111111010100010111111	cbf23f3fb5c33fa8bf
UTF-8	亦껋슜誼뉛┸	111001001011101010100110111010101011101110001011111011001000101010011100111010001010101010111100111010111000100110011011111000101001010010111000	e4baa6eabb8bec8a9ce8aabceb899be294b8
UHC	亦껋슜誼뉛┸	111001101011001010000011111011001001101010101001111010111111111010000111111011111010011010111111	e6b283ec9aa9ebfe87efa6bf

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)