Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	災??億?	10001101110100000011111100111111100010011010110100111111	8dd03f3f89ad3f
EUC-JP	災?藿億?	101110101101001000111111100011111101101010100001101100101010111100111111	bad23f8fdaa1b2af3f
UTF-8	災고藿億렜	111001111000000110111101111010101011001110100000111010001001011110111111111001011000010010000100111010111010000010011100	e781bdeab3a0e897bfe58484eba09c
UHC	災고藿億렜	11101110101011001011000011101101110011101010101111100101111000101000111010101110	eeacb0edceabe5e28eae

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)