Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???????	00111111001111110011111100111111001111110011111100111111	3f3f3f3f3f3f3f
SJIS-WIN	驛???щ??	111010011000001100111111001111110011111110000100100010110011111100111111	e9833f3f3f848b3f3f
EUC-JP	驛???щ??	111100011110001100111111001111110011111110100111111010110011111100111111	f1e33f3f3fa7eb3f3f
UTF-8	驛붾쳞寧щ쨯隣	1110100110101001100110111110101110110110101111101110110010110011100111101110111110100110101010101101000110001001111011001010100010101111111011111010011110110001	e9a99bebb6beecb39eefa6aad189eca8afefa7b1
UHC	驛붾쳞寧щ쨯隣	1110011010111110100101001110101110101011100001001110011110101100101011001110101110100100100010011110110011100100	e6be94ebab84e7acaceba489ece4

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)