Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	曜?＝扼??	100101110110101000111111100000011000000110011101010011100011111100111111	976a3f81819d4e3f3f
EUC-JP	曜?＝扼??	110011011100101100111111101000011110000111011001101011110011111100111111	cdcb3fa1e1d9af3f3f
UTF-8	曜겼＝扼곲굟	111001101001101110011100111010101011001010111100111011111011110010011101111001101000100110111100111010101011001110110010111010101011010110011111	e69b9ceab2bcefbc9de689bceab3b2eab59f
UHC	曜겼＝扼곲굟	111010001111100010110000111001011010001110111101111001001111100110000001111010011000001010000111	e8f8b0e5a3bde4f981e98287

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)