Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????U	00111111001111110011111100111111001111110011111101010101	3f3f3f3f3f3f55
SJIS-WIN	堤?町?瀞?U	10010010111001110011111110010010101011000011111110010011110100100011111101010101	92e73f92ac3f93d23f55
EUC-JP	堤?町?瀞?U	11000100111010010011111111000100101011100011111111000110110101000011111101010101	c4e93fc4ae3fc6d43f55
UTF-8	堤렚町렑瀞렕U	11100101101000001010010011101011101000001001101011100111100101001011101011101011101000001001000111100111100000001001111011101011101000001001010101010101	e5a0a4eba09ae794baeba091e7809eeba09555
UHC	堤렚町렑瀞렕U	11110000101001111000111010101101111011111110101110001110101001101110111111100111100011101010101001010101	f0a78eadefeb8ea6efe78eaa55

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)