Character and Charcode - Check how computer recognize characters

To what bitstring a character(s) is encoded in each character set?

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????????[?????????[^	001111110011111100111111001111110011111100111111001111110011111100111111010110110011111100111111001111110011111100111111001111110011111100111111001111110101101101011110	3f3f3f3f3f3f3f3f3f5b3f3f3f3f3f3f3f3f3f5b5e
SJIS-WIN	弑?????藥??[弑?????藥??[^	10011100010101010011111100111111001111110011111100111111111001010101101000111111001111110101101110011100010101010011111100111111001111110011111100111111111001010101101000111111001111110101101101011110	9c553f3f3f3f3fe55a3f3f5b9c553f3f3f3f3fe55a3f3f5b5e
EUC-JP	弑?????藥??[弑?????藥??[^	11010111101101100011111100111111001111110011111100111111111010011011101100111111001111110101101111010111101101100011111100111111001111110011111100111111111010011011101100111111001111110101101101011110	d7b63f3f3f3f3fe9bb3f3f5bd7b63f3f3f3f3fe9bb3f3f5b5e
UTF-8	弑걢뜞旅덁륗藥굦괥[弑걢뜞旅덁륗藥굦괥[^	111001011011110010010001111010101011000110100010111010111001110010011110111011111010011010000011111010111000110110000001111010111010010110010111111010001001011110100101111010101011010110100110111010101011010010100101010110111110010110111100100100011110101010110001101000101110101110011100100111101110111110100110100000111110101110001101100000011110101110100101100101111110100010010111101001011110101010110101101001101110101010110100101001010101101101011110	e5bc91eab1a2eb9c9eefa683eb8d81eba597e897a5eab5a6eab4a55be5bc91eab1a2eb9c9eefa683eb8d81eba597e897a5eab5a6eab4a55b5e
UHC	弑걢뜞旅덁륗藥굦괥[弑걢뜞旅덁륗藥굦괥[^	111000111011110110000001100010111000110110100001111001101010000110001000111001001000111111111110111001011011011110000010100011001000001001001111010110111110001110111101100000011000101110001101101000011110011010100001100010001110010010001111111111101110010110110111100000101000110010000010010011110101101101011110	e3bd818b8da1e6a188e48ffee5b7828c824f5be3bd818b8da1e6a188e48ffee5b7828c824f5b5e

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)