Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??}Y??}bE	001111110011111101111101010110010011111100111111011111010110001001000101	3f3f7d593f3f7d6245
SJIS-WIN	髴嗣}Y髴嗣}bE	11101001100111001000111001101011011111010101100111101001100111001000111001101011011111010110001001000101	e99c8e6b7d59e99c8e6b7d6245
EUC-JP	髴嗣}Y髴嗣}bE	11110001111111001011101111001100011111010101100111110001111111001011101111001100011111010110001001000101	f1fcbbcc7d59f1fcbbcc7d6245
UTF-8	髴嗣}Y髴嗣}bE	1110100110101011101101001110010110010111101000110111110101011001111010011010101110110100111001011001011110100011011111010110001001000101	e9abb4e597a37d59e9abb4e597a37d6245
UHC	?嗣}Y?嗣}bE	0011111111011110110010110111110101011001001111111101111011001011011111010110001001000101	3fdecb7d593fdecb7d6245

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)