Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	霍御ｻ吝罰	111010001011011110001100111001001011101110011001111001011001010010110001	e8b78ce4bb99e594b1
EUC-JP	霍御ｻ吝罰	11110000101110011011100011100110100011101011101111010010111001111100100010110011	f0b9b8e68ebbd2e7c8b3
UTF-8	霍御ｻ吝罰	111010011001110010001101111001011011111010100001111011111011110110111011111001011001000010011101111001111011110110110000	e99c8de5bea1efbdbbe5909de7bdb0
UHC	?御?吝罰	0011111111100101110110010011111111010111111100001101101111101011	3fe5d93fd7f0dbeb

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)