Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	瀨ﾘ鯡ｸ焏	1111101101010000110110001110100111001010101110001111101101010011	fb50d8e9cab8fb53
EUC-JP	?ﾘ鯡ｸ焏	00111111100011101101100011110010110011001000111010111000100011111100100111101001	3f8ed8f2cc8eb88fc9e9
UTF-8	瀨ﾘ鯡ｸ焏	111001111000000010101000111011111011111010011000111010011010111110100001111011111011110110111000111001111000010010001111	e780a8efbe98e9afa1efbdb8e7848f
UHC	瀨????	110101101110111000111111001111110011111100111111	d6ee3f3f3f3f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)