Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	雋牙ｸｷ豢耽	11101000101100101000100111100101101110001011011111100110101101001001001001011110	e8b289e5b8b7e6b4925e
EUC-JP	雋牙ｸｷ豢耽	111100001011010010110010111001111000111010111000100011101011011111101100101101101100001110111111	f0b4b2e78eb88eb7ecb6c3bf
UTF-8	雋牙ｸｷ豢耽	111010011001101110001011111001111000100110011001111011111011110110111000111011111011110110110111111010001011000110100010111010001000000010111101	e99b8be78999efbdb8efbdb7e8b1a2e880bd
UHC	雋牙???耽	111100011110011011100100101100110011111100111111001111111111011110110000	f1e6e4b33f3f3ff7b0

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)