Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	縊??闇??	1110001101101111001111110011111110001000110001010011111100111111	e36f3f3f88c53f3f
EUC-JP	縊??闇??	1110010111010000001111110011111110110000110001110011111100111111	e5d03f3fb0c73f3f
UTF-8	縊귦뢔闇뒒뢞	111001111011100010001010111010101011011110100110111010111010001010010100111010011001011110000111111010111001001010010010111010111010001010011110	e7b88aeab7a6eba294e99787eb9292eba29e
UHC	縊귦뢔闇뒒뢞	111001001111110010000010111011011000111101001111111001001110000110001010100011111000111101011001	e4fc82ed8f4fe4e18a8f8f59

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)