Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	殿?劍僥	10010011011000010011111110011001100110001001100101000110	93613f99989946
EUC-JP	殿?劍僥	11000101110000100011111111010001111110001101000110100111	c5c23fd1f8d1a7
UTF-8	殿쭹劍僥	111001101010111010111111111011001010110110111001111001011000101010001101111001011000001110100101	e6aebfecadb9e58a8de583a5
UHC	殿쭹劍僥	1110111011111100110000101110011111001011111111001110100011101001	eefcc2e7cbfce8e9

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)