Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????w	00111111001111110011111100111111001111110011111101110111	3f3f3f3f3f3f77
SJIS-WIN	掌??節ｎ?w	10001111101101100011111100111111100100001101111110000010100011100011111101110111	8fb63f3f90df828e3f77
EUC-JP	掌??節ｎ?w	10111110101110000011111100111111110000001110000110100011111011100011111101110111	beb83f3fc0e1a3ee3f77
UTF-8	掌싷풏節ｎ뼅w	11100110100011101000110011101100100010111011011111101101100100101000111111100111101011111000000011101111101111011000111011101011101111001000010101110111	e68e8cec8bb7ed928fe7af80efbd8eebbc8577
UHC	掌싷풏節ｎ뼅w	11101101111001101001101011101111101111101001001111101111101111011010001111101110100101101000111101110111	ede69aefbe93efbda3ee968f77

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)