Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????TB	0011111100111111001111110011111100111111001111110101010001000010	3f3f3f3f3f3f5442
SJIS-WIN	??????TB	0011111100111111001111110011111100111111001111110101010001000010	3f3f3f3f3f3f5442
EUC-JP	??????TB	0011111100111111001111110011111100111111001111110101010001000010	3f3f3f3f3f3f5442
UTF-8	묳묧몺묬몼묬TB	1110101110101100101100111110101110101100101001111110101110101010101110101110101110101100101011001110101110101010101111001110101110101100101011000101010001000010	ebacb3ebaca7ebaabaebacacebaabcebacac5442
UHC	묳묧몺묬몼묬TB	1001001001001010100100011111111010010001101000001001001001000011100100011010000110010010010000110101010001000010	924a91fe91a0924391a192435442

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)