Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	蒹ワ集薨	1110010011100011100000111000111110001111010101111110010101001001	e4e3838f8f57e549
EUC-JP	蒹ワ集薨	1110100011100101101001011110111110111101101110001110100110101010	e8e5a5efbdb8e9aa
UTF-8	蒹ワ集薨	111010001001001010111001111000111000001110101111111010011001101110000110111010001001011010101000	e892b9e383afe99b86e896a8
UHC	?ワ集薨	00111111101010111110111111110011101000101111110110111100	3fabeff3a2fdbc

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)