Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	腫??瑤?沚	100011101110111000111111001111111110101010100010001111111001111110001101	8eee3f3feaa23f9f8d
EUC-JP	腫??瑤?沚	101111001111000000111111001111111111010010100100001111111101110111101101	bcf03f3ff4a43fdded
UTF-8	腫재캑瑤렔沚	111010001000010110101011111011001001111010101100111011001011101010010001111001111001000110100100111010111010000010010100111001101011001010011010	e885abec9eacecba91e791a4eba094e6b29a
UHC	腫재캑瑤렔沚	111100001111111011000000111001111100010010110100111010001111110110001110101010011111001010101111	f0fec0e7c4b4e8fd8ea9f2af

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)