Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	鞳危隙嵭	1110100011100011100010101110101110001100100001001111101010110011	e8e38aeb8c84fab3
EUC-JP	鞳危隙嵭	111100001110010110110100111011011011011111100100100011111011101111011110	f0e5b4edb7e48fbbde
UTF-8	鞳危隙嵭	111010011001111010110011111001011000110110110001111010011001101010011001111001011011010110101101	e99eb3e58db1e99a99e5b5ad
UHC	?危隙?	001111111110101011001011110100001100000000111111	3feacbd0c03f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)