Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????TB	00111111001111110011111100111111001111110101010001000010	3f3f3f3f3f5442
SJIS-WIN	?り?揖?TB	001111111000001011101000001111111001011101001011001111110101010001000010	3f82e83f974b3f5442
EUC-JP	?り?揖?TB	001111111010010011101010001111111100110110101100001111110101010001000010	3fa4ea3fcdac3f5442
UTF-8	閭り내揖멻TB	1110111110100110100001101110001110000010100010101110101110000010101101001110011010001111100101101110101110101001101110110101010001000010	efa686e3828aeb82b4e68f96eba9bb5442
UHC	閭り내揖멻TB	111001101010110110101010111010101011001110111011111010111110011110010001011010000101010001000010	e6adaaeab3bbebe791685442

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)