Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	遲ｱ谿雁ｸ	1110011110101101101100011110011010101110100010101110010110111000	e7adb1e6ae8ae5b8
EUC-JP	遲ｱ谿雁ｸ	11101110101011111000111010110001111011001011000010110100111001111000111010111000	eeaf8eb1ecb0b4e78eb8
UTF-8	遲ｱ谿雁ｸ	111010011000000110110010111011111011110110110001111010001011000010111111111010011001101110000001111011111011110110111000	e981b2efbdb1e8b0bfe99b81efbdb8
UHC	遲?谿雁?	1111001011000000001111111100110110101100111001001101001000111111	f2c03fcdace4d23f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)