Character and Charcode - Check how computer recognize characters

To what bitstring a character(s) is encoded in each character set?

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???????????????????	00111111001111110011111100111111001111110011111100111111001111110011111100111111001111110011111100111111001111110011111100111111001111110011111100111111	3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f
SJIS-WIN	誤??諭??怨?サ瑤?????鷹??額	1000110011101011001111110011111110010111010000000011111100111111100010011000010100111111100000110101010011101010101000100011111100111111001111110011111100111111100100011110100100111111001111111000101001111010	8ceb3f3f97403f3f89853f8354eaa23f3f3f3f3f91e93f3f8a7a
EUC-JP	誤??諭??怨?サ瑤??佾??鷹??額	10111000111011010011111100111111110011011010000100111111001111111011000111100101001111111010010110110101111101001010010000111111001111111000111110110000111110110011111100111111110000101110101100111111001111111011001111011011	b8ed3f3fcda13f3fb1e53fa5b5f4a43f3f8fb0fb3f3fc2eb3f3fb3db
UTF-8	誤곸룆諭뜻젔怨살サ瑤녹쥓佾좄쫨鷹낅쎗額	111010001010101010100100111010101011001110111000111010111010001110000110111010001010101110101101111010111001110010111011111011001010000010010100111001101000000010101000111011001000001010110100111000111000001010110101111001111001000110100100111010111000010110111001111011001010010110010011111001001011110110111110111011001010001010000100111011001010101110101000111010011011011110111001111010111000001010000101111011001000111010010111111010011010000110001101	e8aaa4eab3b8eba386e8abadeb9cbbeca094e680a8ec82b4e382b5e791a4eb85b9eca593e4bdbeeca284ecaba8e9b7b9eb8285ec8e97e9a18d
UHC	誤곸룆諭뜻젔怨살サ瑤녹쥓佾좄쫨鷹낅쎗額	1110100010100110100000011110110010001111100001011110101110110001101101101110011010100000100100101110101010110011101110111110110010101011101101011110100011111101101100111110110010100010100010101110110011101011101000001110100010100110100000011110101111101101100001011110101110011011101111101110010011111110	e8a681ec8f85ebb1b6e6a092eab3bbecabb5e8fdb3eca28aeceba0e8a681ebed85eb9bbee4fe

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)