Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????B	00111111001111110011111100111111001111110011111101000010	3f3f3f3f3f3f42
SJIS-WIN	俑??俑??B	100110001101101000111111001111111001100011011010001111110011111101000010	98da3f3f98da3f3f42
EUC-JP	俑??俑??B	110100001101110000111111001111111101000011011100001111110011111101000010	d0dc3f3fd0dc3f3f42
UTF-8	俑얊뫃俑얊뫃B	11100100101111111001000111101100100101101000101011101011101010111000001111100100101111111001000111101100100101101000101011101011101010111000001101000010	e4bf91ec968aebab83e4bf91ec968aebab8342
UHC	俑얊뫃俑얊뫃B	11101001101101011001110111111000100100011010011111101001101101011001110111111000100100011010011101000010	e9b59df891a7e9b59df891a742

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)