Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	?善??懶蹙	001111111001000101010000001111110011111110011100111011111110011101000101	3f91503f3f9cefe745
EUC-JP	?善?雩懶蹙	0011111111000001101100010011111110001111111001101111101011011000111100011110110110100110	3fc1b13f8fe6fad8f1eda6
UTF-8	뤶善썸雩懶蹙	111010111010010010110110111001011001011010000100111011001000110110111000111010011001101110101001111001101000011110110110111010001011100110011001	eba4b6e59684ec8db8e99ba9e687b6e8b999
UHC	뤶善썸雩懶蹙	100011111110010011100000101111001011110111100110111010011110110011010100111110111111010111101100	8fe4e0bcbde6e9ecd4fbf5ec

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)