Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	厓?????	11111010100011010011111100111111001111110011111100111111	fa8d3f3f3f3f3f
EUC-JP	厓??琰??	10001111101101001100011100111111001111111000111111001100101101000011111100111111	8fb4c73f3f8fccb43f3f
UTF-8	厓꿰떬琰녔즳	111001011000111010010011111010101011111110110000111010111001011010101100111001111001000010110000111010111000010110010100111011001010011010110011	e58e93eabfb0eb96ace790b0eb8594eca6b3
UHC	厓꿰떬琰녔즳	111001001110110110110010111001111000101110111100111001101111110010110011111001101010001110000101	e4edb2e78bbce6fcb3e6a385

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)