Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	終?蚣夭頭	100011110100100100111111111001010110111010011010111011101001001110101010	8f493fe56e9aee93aa
EUC-JP	終?蚣夭頭	101111011010101000111111111010011100111111010100111100001100011010101100	bdaa3fe9cfd4f0c6ac
UTF-8	終쇠蚣夭頭	111001111011010110000010111011001000011110100000111010001001101010100011111001011010010010101101111010011010000010101101	e7b582ec87a0e89aa3e5a4ade9a0ad
UHC	終쇠蚣夭頭	11110000111110111011110011101000110011011111011111101000111011001101010011101001	f0fbbce8cdf7e8ecd4e9

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)