Character and Charcode - Check how computer recognize characters

To what bitstring a character(s) is encoded in each character set?

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??]nf??]n^}Y??]nf??]n^}bE	00111111001111110101110101101110011001100011111100111111010111010110111001011110011111010101100100111111001111110101110101101110011001100011111100111111010111010110111001011110011111010110001001000101	3f3f5d6e663f3f5d6e5e7d593f3f5d6e663f3f5d6e5e7d6245
SJIS-WIN	賊遭]nf賊遭]n^}Y賊遭]nf賊遭]n^}bE	100100011010111110010001100110000101110101101110011001101001000110101111100100011001100001011101011011100101111001111101010110011001000110101111100100011001100001011101011011100110011010010001101011111001000110011000010111010110111001011110011111010110001001000101	91af91985d6e6691af91985d6e5e7d5991af91985d6e6691af91985d6e5e7d6245
EUC-JP	賊遭]nf賊遭]n^}Y賊遭]nf賊遭]n^}bE	110000101011000111000001111110000101110101101110011001101100001010110001110000011111100001011101011011100101111001111101010110011100001010110001110000011111100001011101011011100110011011000010101100011100000111111000010111010110111001011110011111010110001001000101	c2b1c1f85d6e66c2b1c1f85d6e5e7d59c2b1c1f85d6e66c2b1c1f85d6e5e7d6245
UTF-8	賊遭]nf賊遭]n^}Y賊遭]nf賊遭]n^}bE	1110100010110011100010101110100110000001101011010101110101101110011001101110100010110011100010101110100110000001101011010101110101101110010111100111110101011001111010001011001110001010111010011000000110101101010111010110111001100110111010001011001110001010111010011000000110101101010111010110111001011110011111010110001001000101	e8b38ae981ad5d6e66e8b38ae981ad5d6e5e7d59e8b38ae981ad5d6e66e8b38ae981ad5d6e5e7d6245
UHC	賊遭]nf賊遭]n^}Y賊遭]nf賊遭]n^}bE	111011101110010011110000111001000101110101101110011001101110111011100100111100001110010001011101011011100101111001111101010110011110111011100100111100001110010001011101011011100110011011101110111001001111000011100100010111010110111001011110011111010110001001000101	eee4f0e45d6e66eee4f0e45d6e5e7d59eee4f0e45d6e66eee4f0e45d6e5e7d6245

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)