Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	五??嵬?	10001100110111000011111100111111100110111100101000111111	8cdc3f3f9bca3f
EUC-JP	五??嵬?	10111000110111100011111100111111110101101100110000111111	b8de3f3fd6cc3f
UTF-8	五쒐퇁嵬뗨	111001001011101010010100111011001001001010010000111011011000011110000001111001011011010110101100111010111001011110101000	e4ba94ec9290ed8781e5b5aceb97a8
UHC	五쒐퇁嵬뗨	11100111111010011001110011100111101101111001001011101000111000111000101111101000	e7e99ce7b792e8e38be8

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)