Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	挾?鬚?	100111010111000000111111111010011010001000111111	9d703fe9a23f
EUC-JP	挾?鬚?	110110011101000100111111111100101010010000111111	d9d13ff2a43f
UTF-8	挾믐鬚쀼	111001101000110010111110111010111010111110010000111010011010110010011010111011001000000010111100	e68cbeebaf90e9ac9aec80bc
UHC	挾믐鬚쀼	1111101011110011101110011100101011100010110100011011101111011000	faf3b9cae2d1bbd8

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)