Character and Charcode - Check how computer recognize characters

To what bitstring a character(s) is encoded in each character set?

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???????????????????	00111111001111110011111100111111001111110011111100111111001111110011111100111111001111110011111100111111001111110011111100111111001111110011111100111111	3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f
SJIS-WIN	誤??韋??衰??巍リ?宥??垂??悠	100011001110101100111111001111111110100011101000001111110011111110010000100010100011111100111111100110111101100110000011100010100011111110010111010001110011111100111111100100001000001000111111001111111001011101001001	8ceb3f3fe8e83f3f908a3f3f9bd9838a3f97473f3f90823f3f9749
EUC-JP	誤??韋??衰??巍リ?宥??垂??悠	101110001110110100111111001111111111000011101010001111110011111110111111111010100011111100111111110101101101101110100101111010100011111111001101101010000011111100111111101111111110001000111111001111111100110110101010	b8ed3f3ff0ea3f3fbfea3f3fd6dba5ea3fcda83f3fbfe23f3fcdaa
UTF-8	誤곸룆韋귟린衰⑸짎巍リ랩宥욃슖垂귥궛悠	111010001010101010100100111010101011001110111000111010111010001110000110111010011001111110001011111010101011011110011111111010111010011010110000111010001010000110110000111000101001000110111000111011001010011110001110111001011011011110001101111000111000001110101010111010111001111010101001111001011010111010100101111011001001101010000011111011001000101010010110111001011001111010000010111010101011011110100101111010101011011010011011111001101000001010100000	e8aaa4eab3b8eba386e99f8beab79feba6b0e8a1b0e291b8eca78ee5b78de383aaeb9ea9e5aea5ec9a83ec8a96e59e82eab7a5eab69be682a0
UHC	誤곸룆韋귟린衰⑸짎巍リ랩宥욃슖垂귥궛悠	1110100010100110100000011110110010001111100001011110101011011111100000101110100010111000101100001110000111110001101010011110101110100011100110101110100011100100101010111110101010110111101001101110101011101001100111101110010110011010101001011110000111110111100000101110110010000010101100001110101011101101	e8a681ec8f85eadf82e8b8b0e1f1a9eba39ae8e4abeab7a6eae99ee59aa5e1f782ec82b0eaed

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)