Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	紊結郷痰	1110001101000011100011001000101110001011101111011110000110000010	e3438c8b8bbde182
EUC-JP	紊結郷痰	1110010110100100101101111110101110110110101111111110000111100010	e5a4b7ebb6bfe1e2
UTF-8	紊結郷痰	111001111011010010001010111001111011010110010000111010011000001110110111111001111001011110110000	e7b48ae7b590e983b7e797b0
UHC	紊結?痰	11011010101000101100110010111111001111111101001111000011	daa2ccbf3fd3c3

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)