Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	蜈ゆ?域よ	111001011000010110000010111001000011111110001000111001101000001011100110	e58582e43f88e682e6
EUC-JP	蜈ゆ?域よ	111010011110010110100100111001100011111110110000111010001010010011101000	e9e5a4e63fb0e8a4e8
UTF-8	蜈ゆ뿧域よ	111010001001110010001000111000111000001010000110111010111011111110100111111001011001111110011111111000111000001010001000	e89c88e38286ebbfa7e59f9fe38288
UHC	蜈ゆ뿧域よ	11101000101001011010101011100110100101111010011111100110101101001010101011101000	e8a5aae697a7e6b4aae8

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)