Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	?ラ?仰??	0011111110000011100010010011111110001011110000100011111100111111	3f83893f8bc23f3f
EUC-JP	?ラ?仰??	0011111110100101111010010011111110110110110001000011111100111111	3fa5e93fb6c43f3f
UTF-8	筽ラ뇦仰앯껍	111001111010110110111101111000111000001110101001111010111000011110100110111001001011101110110000111011001001010110101111111010101011101110001101	e7adbde383a9eb87a6e4bbb0ec95afeabb8d
UHC	筽ラ뇦仰앯껍	111010001010010010101011111010011000011110001110111001001110011010011101111001111011001010101110	e8a4abe9878ee4e69de7b2ae

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)