Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	蒡湲危┌褥	11100100111011101001111111010001100010101110101110000100101000011110010111110001	e4ee9fd18aeb84a1e5f1
EUC-JP	蒡湲危┌褥	11101000111100001101111011010011101101001110110110101000101000111110101011110011	e8f0ded3b4eda8a3eaf3
UTF-8	蒡湲危┌褥	111010001001001010100001111001101011100110110010111001011000110110110001111000101001010010001100111010001010010010100101	e892a1e6b9b2e58db1e2948ce8a4a5
UHC	蒡湲危┌褥	11011011101111001110101010111000111010101100101110100110101000111110100110110011	dbbceab8eacba6a3e9b3

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)