Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????BF	00111111001111110011111100111111001111110100001001000110	3f3f3f3f3f4246
SJIS-WIN	汚??囚?BF	100010011001100000111111001111111000111011111010001111110100001001000110	89983f3f8efa3f4246
EUC-JP	汚??囚?BF	101100011111100000111111001111111011110011111100001111110100001001000110	b1f83f3fbcfc3f4246
UTF-8	汚꾤츦囚꿵BF	1110011010110001100110101110101010111110101001001110110010111000101001101110010110011011100110101110101010111111101101010100001001000110	e6b19aeabea4ecb8a6e59b9aeabfb54246
UHC	汚꾤츦囚꿵BF	111001111111110110000100111001111010111010011100111000011111011010000101011011110100001001000110	e7fd84e7ae9ce1f6856f4246

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)