Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	鬮大｡鈴ｫ	1110100110101011100100011110010110100001100101111110100110101011	e9ab91e5a197e9ab
EUC-JP	鬮大｡鈴ｫ	11110010101011011100001011100111100011101010000111001110111010111000111010101011	f2adc2e78ea1ceeb8eab
UTF-8	鬮大｡鈴ｫ	111010011010110010101110111001011010010010100111111011111011110110100001111010011000100010110100111011111011110110101011	e9acaee5a4a7efbda1e988b4efbdab
UHC	?大?鈴?	00111111110100111101111000111111110101101100001000111111	3fd3de3fd6c23f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)