Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?k?bB	0011111101101011001111110110001001000010	3f6b3f6242
SJIS-WIN	巽k但bB	10010010010001100110101110010010010000010110001001000010	92466b92416242
EUC-JP	巽k但bB	11000011101001110110101111000011101000100110001001000010	c3a76bc3a26242
UTF-8	巽k但bB	111001011011011110111101011010111110010010111101100001100110001001000010	e5b7bd6be4bd866242
UHC	巽k但bB	11100001110111100110101111010011101000110110001001000010	e1de6bd3a36242

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)