Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	邨匁愕郢崎楜	111001111011010110010110111001101001110010110001111001111011100110001101111010001001111010110011	e7b596e69cb1e7b98de89eb3
EUC-JP	邨匁愕郢崎楜	111011101011011111001100111010001101100010110011111011101011101110111010111010101101110010110101	eeb7cce8d8b3eebbbaeadcb5
UTF-8	邨匁愕郢崎楜	111010011000001010101000111001011000110010000001111001101000010010010101111010011000001110100010111001011011010010001110111001101010010110011100	e982a8e58c81e68495e983a2e5b48ee6a59c
UHC	邨?愕?崎?	111101011011111000111111111001001100001100111111110100001111100000111111	f5be3fe4c33fd0f83f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)