Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???????B	0011111100111111001111110011111100111111001111110011111101000010	3f3f3f3f3f3f3f42
SJIS-WIN	???????B	0011111100111111001111110011111100111111001111110011111101000010	3f3f3f3f3f3f3f42
EUC-JP	???????B	0011111100111111001111110011111100111111001111110011111101000010	3f3f3f3f3f3f3f42
UTF-8	뤶쫷쐬렕앉렻석B	11101011101001001011011011101100101010111011011111101100100100001010110011101011101000001001010111101100100101011000100111101011101000001011101111101100100001001001110101000010	eba4b6ecabb7ec90aceba095ec9589eba0bbec849d42
UHC	뤶쫷쐬렕앉렻석B	100011111110010010100110100011101011110111111101100011101010101010111110110010011000111011000011101111001010111001000010	8fe4a68ebdfd8eaabec98ec3bcae42

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)