Character and Charcode - Check how computer recognize characters

To what bitstring a character(s) is encoded in each character set?

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???????????????????	00111111001111110011111100111111001111110011111100111111001111110011111100111111001111110011111100111111001111110011111100111111001111110011111100111111	3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f
SJIS-WIN	誤??韋??衰??巍リ?膺??恂レ??	100011001110101100111111001111111110100011101000001111110011111110010000100010100011111100111111100110111101100110000011100010100011111111100100010111100011111100111111100111001001011010000011100011000011111100111111	8ceb3f3fe8e83f3f908a3f3f9bd9838a3fe45e3f3f9c96838c3f3f
EUC-JP	誤??韋??衰??巍リ?膺??恂レ??	101110001110110100111111001111111111000011101010001111110011111110111111111010100011111100111111110101101101101110100101111010100011111111100111101111110011111100111111110101111111011010100101111011000011111100111111	b8ed3f3ff0ea3f3fbfea3f3fd6dba5ea3fe7bf3f3fd7f6a5ec3f3f
UTF-8	誤곸룆韋귟린衰⑸짎巍リ랜膺쀥톹恂レ탳亮	111010001010101010100100111010101011001110111000111010111010001110000110111010011001111110001011111010101011011110011111111010111010011010110000111010001010000110110000111000101001000110111000111011001010011110001110111001011011011110001101111000111000001110101010111010111001111010011100111010001000011010111010111011001000000010100101111011011000011010111001111001101000000110000010111000111000001110101100111011011000001110110011111011111010010110110111	e8aaa4eab3b8eba386e99f8beab79feba6b0e8a1b0e291b8eca78ee5b78de383aaeb9e9ce886baec80a5ed86b9e68182e383aced83b3efa5b7
UHC	誤곸룆韋귟린衰⑸짎巍リ랜膺쀥톹恂レ탳亮	1110100010100110100000011110110010001111100001011110101011011111100000101110100010111000101100001110000111110001101010011110101110100011100110101110100011100100101010111110101010110111101000111110101111101100100101111110010110110111100011011110001011100001101010111110110010110101100100001110010110111001	e8a681ec8f85eadf82e8b8b0e1f1a9eba39ae8e4abeab7a3ebec97e5b78de2e1abecb590e5b9

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)