Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	樗槃飛原	1001001010010100100111101100111110010100111100101000110010110100	92949ecf94f28cb4
EUC-JP	樗槃飛原	1100001111110100110111001101000111001000111101001011100010110110	c3f4dcd1c8f4b8b6
UTF-8	樗槃飛原	111001101010100010010111111001101010011110000011111010011010001110011011111001011000111010011111	e6a897e6a783e9a39be58e9f
UHC	樗槃飛原	1110111011000000110110101110100111011110101010111110101010101011	eec0dae9deabeaab

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)