Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????OB	00111111001111110011111100111111001111110100111101000010	3f3f3f3f3f4f42
SJIS-WIN	蟾舌ｏ莠ｳOB	1110010110110111100100001110001110000010100011111110010010111010101100110100111101000010	e5b790e3828fe4bab34f42
EUC-JP	蟾舌ｏ莠ｳOB	111010101011100111000000111001011010001111101111111010001011110010001110101100110100111101000010	eab9c0e5a3efe8bc8eb34f42
UTF-8	蟾舌ｏ莠ｳOB	1110100010011111101111101110100010001000100011001110111110111101100011111110100010001110101000001110111110111101101100110100111101000010	e89fbee8888cefbd8fe88ea0efbdb34f42
UHC	蟾舌ｏ??OB	11100000111010101110000011011111101000111110111100111111001111110100111101000010	e0eae0dfa3ef3f3f4f42

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)