Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????B	0011111100111111001111110011111101000010	3f3f3f3f42
SJIS-WIN	釥蒔釥蒔B	111110111100000010001110101010101111101111000000100011101010101001000010	fbc08eaafbc08eaa42
EUC-JP	釥蒔釥蒔B	1000111111100011101010111011110010101100100011111110001110101011101111001010110001000010	8fe3abbcac8fe3abbcac42
UTF-8	釥蒔釥蒔B	11101001100001111010010111101000100100101001010011101001100001111010010111101000100100101001010001000010	e987a5e89294e987a5e8929442
UHC	?蒔?蒔B	00111111111000111100100000111111111000111100100001000010	3fe3c83fe3c842

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)