Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	脛ゆ燦藪	1110001111111000100000101110010010001110010101111110010101001101	e3f882e48e57e54d
EUC-JP	脛ゆ燦藪	1110011011111010101001001110011010111011101110001110100110101110	e6faa4e6bbb8e9ae
UTF-8	脛ゆ燦藪	111010001000010010011011111000111000001010000110111001111000011110100110111010001001011110101010	e8849be38286e787a6e897aa
UHC	脛ゆ燦藪	1100110011101011101010101110011011110011101111101110001010111111	ccebaae6f3bee2bf

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)