Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???®?	0011111100111111001111111010111000111111	3f3f3fae3f
SJIS-WIN	碇?渦??	10010010111101000011111110001001010100010011111100111111	92f43f89513f3f
EUC-JP	碇?渦®?	110001001111011000111111101100011011001010001111101000101110111000111111	c4f63fb1b28fa2ee3f
UTF-8	碇렢渦®ㅉ	1110011110100010100001111110101110100000101000101110011010111000101001101100001010101110111000111000010110001001	e7a287eba0a2e6b8a6c2aee38589
UHC	碇렢渦®ㅉ	11101111111011011000111010110011111010001011111010100010111001111010010010111001	efed8eb3e8bea2e7a4b9

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)