Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	ﾘ酊ｲ霖	1111000011111011110110001110011111000010101100101110100011000001	f0fbd8e7c2b2e8c1
EUC-JP	?ﾘ酊ｲ霖	001111111000111011011000111011101100010010001110101100101111000011000011	3f8ed8eec48eb2f0c3
UTF-8	ﾘ酊ｲ霖	111011101000001010111010111011111011111010011000111010011000010110001010111011111011110110110010111010011001110010010110	ee82baefbe98e9858aefbdb2e99c96
UHC	??酊?霖	00111111001111111110111111111000001111111101011111111101	3f3feff83fd7fd

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)