Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	驥泓諜寀	1110100110000111100111111001011110010010101100111111101010100111	e9879f9792b3faa7
EUC-JP	驥泓諜寀	111100011110011111011101111101111100010010110101100011111011101011011011	f1e7ddf7c4b58fbadb
UTF-8	驥泓諜寀	111010011010100110100101111001101011001110010011111010001010101110011100111001011010111110000000	e9a9a5e6b393e8ab9ce5af80
UHC	驥泓諜寀	1101000111001010111110111111001011110100111000111111001111110010	d1cafbf2f4e3f3f2

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)