Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	筬窮該箝	1110001010101011100010111000011110001010010110011110001010101101	e2ab8b878a59e2ad
EUC-JP	筬窮該箝	1110010010101101101101011110011110110011101110101110010010101111	e4adb5e7b3bae4af
UTF-8	筬窮該箝	111001111010110110101100111001111010101010101110111010001010100110110010111001111010111010011101	e7adace7aaaee8a9b2e7ae9d
UHC	筬窮該箝	1110000011111110110011111110001111111010101100011100110011000100	e0fecfe3fab1ccc4

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)