Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????B	00111111001111110011111100111111001111110011111101000010	3f3f3f3f3f3f42
SJIS-WIN	維??萸?しB	10001000110110110011111100111111111001001100111000111111100000101011010101000010	88db3f3fe4ce3f82b542
EUC-JP	維??萸?しB	10110000110111010011111100111111111010001101000000111111101001001011011101000010	b0dd3f3fe8d03fa4b742
UTF-8	維쒕쳥萸녿しB	11100111101101101010110111101100100100101001010111101100101100111010010111101000100100001011100011101011100001011011111111100011100000011001011101000010	e7b6adec9295ecb3a5e890b8eb85bfe3819742
UHC	維쒕쳥萸녿しB	11101011101010111001110011101011101010111000101011101011101011011000011011101011101010101011011101000010	ebab9cebab8aebad86ebaab742

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)