Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??A[??A[B	001111110011111101000001010110110011111100111111010000010101101101000010	3f3f415b3f3f415b42
SJIS-WIN	嶸ｪA[嶸ｪA[B	1111101010110100101010100100000101011011111110101011010010101010010000010101101101000010	fab4aa415bfab4aa415b42
EUC-JP	嶸ｪA[嶸ｪA[B	100011111011101111110100100011101010101001000001010110111000111110111011111101001000111010101010010000010101101101000010	8fbbf48eaa415b8fbbf48eaa415b42
UTF-8	嶸ｪA[嶸ｪA[B	1110010110110110101110001110111110111101101010100100000101011011111001011011011010111000111011111011110110101010010000010101101101000010	e5b6b8efbdaa415be5b6b8efbdaa415b42
UHC	嶸?A[嶸?A[B	1110011110101110001111110100000101011011111001111010111000111111010000010101101101000010	e7ae3f415be7ae3f415b42

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)