Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	訛齧設褻	1110011001100001111010101001011010010000110111011110010111110110	e661ea9690dde5f6
EUC-JP	訛齧設褻	1110101111000010111100111111011011000000110111111110101011111000	ebc2f3f6c0dfeaf8
UTF-8	訛齧設褻	111010001010100010011011111010011011110110100111111010001010100010101101111010001010010010111011	e8a89be9bda7e8a8ade8a4bb
UHC	訛齧設褻	1110100011000101111000001110010111100000111000101110000011100001	e8c5e0e5e0e2e0e1

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)