Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	鴫肛汐	11110000111110101000111010110000111000111110100010001110101011001111001010100101	f0fa8eb0e3e88eacf2a5
EUC-JP	?鴫肛汐?	0011111110111100101100101110011011101010101111001010111000111111	3fbcb2e6eabcae3f
UTF-8	鴫肛汐	111011101000001010111001111010011011010010101011111010001000001010011011111001101011000110010000111011101000011110011100	ee82b9e9b4abe8829be6b190ee879c
UHC	??肛汐?	00111111001111111111100111111101111000001011000100111111	3f3ff9fde0b13f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)