Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????k	0011111100111111001111110011111101101011	3f3f3f3f6b
SJIS-WIN	示治璽汐k	100011101010011010001110101000011000111010100011100011101010110001101011	8ea68ea18ea38eac6b
EUC-JP	示治璽汐k	101111001010100010111100101000111011110010100101101111001010111001101011	bca8bca3bca5bcae6b
UTF-8	示治璽汐k	11100111101001001011101011100110101100101011101111100111100100101011110111100110101100011001000001101011	e7a4bae6b2bbe792bde6b1906b
UHC	示治璽汐k	111000111100011011110110101111011101111111011110111000001011000101101011	e3c6f6bddfdee0b16b

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)