Character and Charcode - Check how computer recognize characters

To what bitstring a character(s) is encoded in each character set?

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????????????????????????B	00111111001111110011111100111111001111110011111100111111001111110011111100111111001111110011111100111111001111110011111100111111001111110011111100111111001111110011111100111111001111110011111101000010	3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f42
SJIS-WIN	第頭??遵?第豆??倚?第頭??遵?第豆??倚?B	10010001111001101001001110101010001111110011111110001111100001010011111110010001111001101001001110100100001111110011111110011000110111110011111110010001111001101001001110101010001111110011111110001111100001010011111110010001111001101001001110100100001111110011111110011000110111110011111101000010	91e693aa3f3f8f853f91e693a43f3f98df3f91e693aa3f3f8f853f91e693a43f3f98df3f42
EUC-JP	第頭??遵?第豆??倚?第頭??遵?第豆??倚?B	11000010111010001100011010101100001111110011111110111101111001010011111111000010111010001100011010100110001111110011111111010000111000010011111111000010111010001100011010101100001111110011111110111101111001010011111111000010111010001100011010100110001111110011111111010000111000010011111101000010	c2e8c6ac3f3fbde53fc2e8c6a63f3fd0e13fc2e8c6ac3f3fbde53fc2e8c6a63f3fd0e13f42
UTF-8	第頭렗렗遵렕第豆렎렒倚렣第頭렗렗遵렕第豆렎렒倚렣B	11100111101011001010110011101001101000001010110111101011101000001001011111101011101000001001011111101001100000011011010111101011101000001001010111100111101011001010110011101000101100011000011011101011101000001000111011101011101000001001001011100101100000001001101011101011101000001010001111100111101011001010110011101001101000001010110111101011101000001001011111101011101000001001011111101001100000011011010111101011101000001001010111100111101011001010110011101000101100011000011011101011101000001000111011101011101000001001001011100101100000001001101011101011101000001010001101000010	e7acace9a0adeba097eba097e981b5eba095e7acace8b186eba08eeba092e5809aeba0a3e7acace9a0adeba097eba097e981b5eba095e7acace8b186eba08eeba092e5809aeba0a342
UHC	第頭렗렗遵렕第豆렎렒倚렣第頭렗렗遵렕第豆렎렒倚렣B	11110000101011111101010011101001100011101010110010001110101011001111000111100101100011101010101011110000101011111101010011100111100011101010010010001110101001111110101111101111100011101011010011110000101011111101010011101001100011101010110010001110101011001111000111100101100011101010101011110000101011111101010011100111100011101010010010001110101001111110101111101111100011101011010001000010	f0afd4e98eac8eacf1e58eaaf0afd4e78ea48ea7ebef8eb4f0afd4e98eac8eacf1e58eaaf0afd4e78ea48ea7ebef8eb442

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)