Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	池?湖削	10010010011100100011111110001100110011101000110111101101	92723f8cce8ded
EUC-JP	池?湖削	11000011110100110011111110111000110100001011101011101111	c3d33fb8d0baef
UTF-8	池렠湖削	111001101011000110100000111010111010000010100000111001101011100110010110111001011000100110001010	e6b1a0eba0a0e6b996e5898a
UHC	池렠湖削	1111001010101110100011101011000111111011110010011101111011111011	f2ae8eb1fbc9defb

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)