Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????B	00111111001111110011111100111111001111110011111101000010	3f3f3f3f3f3f42
SJIS-WIN	貞???沮?B	100100101110010100111111001111110011111110011111100111000011111101000010	92e53f3f3f9f9c3f42
EUC-JP	貞???沮?B	110001001110011100111111001111110011111111011101111111000011111101000010	c4e73f3f3fddfc3f42
UTF-8	貞렓渽렜沮챠B	11101000101100101001111011101011101000001001001111100110101110001011110111101011101000001001110011100110101100101010111011101100101100011010000001000010	e8b29eeba093e6b8bdeba09ce6b2aeecb1a042
UHC	貞렓渽렜沮챠B	11101111111101101000111010101000111011101010101010001110101011101110111011000001110000111010110101000010	eff68ea8eeaa8eaeeec1c3ad42

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)