Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??z??zB	00111111001111110111101000111111001111110111101001000010	3f3f7a3f3f7a42
SJIS-WIN	宍杓z宍杓zB	1000111010110011100011101101101101111010100011101011001110001110110110110111101001000010	8eb38edb7a8eb38edb7a42
EUC-JP	宍杓z宍杓zB	1011110010110101101111001101110101111010101111001011010110111100110111010111101001000010	bcb5bcdd7abcb5bcdd7a42
UTF-8	宍杓z宍杓zB	111001011010111010001101111001101001110110010011011110101110010110101110100011011110011010011101100100110111101001000010	e5ae8de69d937ae5ae8de69d937a42
UHC	?杓z?杓zB	001111111111100011110101011110100011111111111000111101010111101001000010	3ff8f57a3ff8f57a42

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)