Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	伊豆?頭?寃	10001000110010011001001110100100001111111001001110101010001111111001101110000011	88c993a43f93aa3f9b83
EUC-JP	伊豆?頭?寃	10110000110010111100011010100110001111111100011010101100001111111101010111100011	b0cbc6a63fc6ac3fd5e3
UTF-8	伊豆렎頭稶寃	111001001011110010001010111010001011000110000110111010111010000010001110111010011010000010101101111001111010100010110110111001011010111110000011	e4bc8ae8b186eba08ee9a0ade7a8b6e5af83
UHC	伊豆렎頭稶寃	111011001010010111010100111001111000111010100100110101001110100111101001111100111110101010110010	eca5d4e78ea4d4e9e9f3eab2

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)