Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	硝ｿ蕉ﾚ	100011111100100110111111100011111101010011011010	8fc9bf8fd4da
EUC-JP	硝ｿ蕉ﾚ	1011111011001011100011101011111110111110110101101000111011011010	becb8ebfbed68eda
UTF-8	硝ｿ蕉ﾚ	111001111010000110011101111011111011110110111111111010001001010110001001111011111011111010011010	e7a19defbdbfe89589efbe9a
UHC	硝?蕉?	111101011010011000111111111101011010111100111111	f5a63ff5af3f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)