Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??GO??AB	0011111100111111010001110100111100111111001111110100000101000010	3f3f474f3f3f4142
SJIS-WIN	嶸ｪGO嶸ｪAB	11111010101101001010101001000111010011111111101010110100101010100100000101000010	fab4aa474ffab4aa4142
EUC-JP	嶸ｪGO嶸ｪAB	1000111110111011111101001000111010101010010001110100111110001111101110111111010010001110101010100100000101000010	8fbbf48eaa474f8fbbf48eaa4142
UTF-8	嶸ｪGO嶸ｪAB	11100101101101101011100011101111101111011010101001000111010011111110010110110110101110001110111110111101101010100100000101000010	e5b6b8efbdaa474fe5b6b8efbdaa4142
UHC	嶸?GO嶸?AB	11100111101011100011111101000111010011111110011110101110001111110100000101000010	e7ae3f474fe7ae3f4142

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)