Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	翁?窪橋牙	100010011010010100111111100011000100010110001011101101001000100111100101	89a53f8c458bb489e5
EUC-JP	翁?窪橋牙	101100101010011100111111101101111010011010110110101101101011001011100111	b2a73fb7a6b6b6b2e7
UTF-8	翁렫窪橋牙	111001111011111110000001111010111010000010101011111001111010101010101010111001101010100110001011111001111000100110011001	e7bf81eba0abe7aaaae6a98be78999
UHC	翁렫窪橋牙	11101000101110101000111010111001111010001100000111001110111010011110010010110011	e8ba8eb9e8c1cee9e4b3

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)