Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	驕泌ｭｫ驕疲	11101001100000011001010011100101101011011010101111101001100000011001010011100110	e98194e5adabe98194e6
EUC-JP	驕泌ｭｫ驕疲	111100011110000111001000111001111000111010101101100011101010101111110001111000011100100011101000	f1e1c8e78ead8eabf1e1c8e8
UTF-8	驕泌ｭｫ驕疲	111010011010100110010101111001101011001110001100111011111011110110101101111011111011110110101011111010011010100110010101111001111001011010110010	e9a995e6b38cefbdadefbdabe9a995e796b2
UHC	驕泌??驕疲	11001110111101101111100110110010001111110011111111001110111101101111100110101010	cef6f9b23f3fcef6f9aa

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)