Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	晤ょ??よ（	10011101111010111000001011100101001111110011111110000010111001101000000101101001	9deb82e53f3f82e68169
EUC-JP	晤ょ??よ（	11011010111011011010010011100111001111110011111110100100111010001010000111001010	daeda4e73f3fa4e8a1ca
UTF-8	晤ょ㈅銳よ（	111001101001100110100100111000111000001010000111111000111000100010000101111010011000101010110011111000111000001010001000111011111011110010001000	e699a4e38287e38885e98ab3e38288efbc88
UHC	晤ょ㈅銳よ（	111001111111101110101010111001111010100110110110111001111110010110101010111010001010001110101000	e7fbaae7a9b6e7e5aae8a3a8

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)