Character and Charcode - Check how computer recognize characters

To what bitstring a character(s) is encoded in each character set?

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???????????????B	00111111001111110011111100111111001111110011111100111111001111110011111100111111001111110011111100111111001111110011111101000010	3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f42
SJIS-WIN	藥??逸??一?????埇??B	1110010101011010001111110011111110001000111011010011111100111111100010001110101000111111001111110011111100111111001111111111101010011010001111110011111101000010	e55a3f3f88ed3f3f88ea3f3f3f3f3ffa9a3f3f42
EUC-JP	藥??逸??一?????埇??B	111010011011101100111111001111111011000011101111001111110011111110110000111011000011111100111111001111110011111100111111100011111011011111100111001111110011111101000010	e9bb3f3fb0ef3f3fb0ec3f3f3f3f3f8fb7e73f3f42
UTF-8	藥띲끏逸썽뭣一곩톹栒욱뫝埇쏀땫B	11101000100101111010010111101011100111011011001011101011100000011000111111101001100000001011100011101100100011011011110111101011101011011010001111100100101110001000000011101010101100111010100111101101100001101011100111100110101000001001001011101100100110101011000111101011101010111001110111100101100111111000011111101100100011111000000011101011100101011010101101000010	e897a5eb9db2eb818fe980b8ec8dbdebada3e4b880eab3a9ed86b9e6a092ec9ab1ebab9de59f87ec8f80eb95ab42
UHC	藥띲끏逸썽뭣一곩톹栒욱뫝埇쏀땫B	11100101101101111000110111100011100001011011111111101100111011111011110111101001101110011011110111101100111010011000000111100101101101111000110111100010111000111011111111101101100100011011110111101001101110011011110111101101100010111000000101000010	e5b78de385bfecefbde9b9bdece981e5b78de2e3bfed91bde9b9bded8b8142

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)