Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????D	00111111001111110011111100111111001111110011111101000100	3f3f3f3f3f3f44
SJIS-WIN	汚??節わ?D	10001001100110000011111100111111100100001101111110000010111011010011111101000100	89983f3f90df82ed3f44
EUC-JP	汚??節わ?D	10110001111110000011111100111111110000001110000110100100111011110011111101000100	b1f83f3fc0e1a4ef3f44
UTF-8	汚녽줁節わ쉼D	11100110101100011001101011101011100001011011110111101100101001001000000111100111101011111000000011100011100000101000111111101100100010011011110001000100	e6b19aeb85bdeca481e7af80e3828fec89bc44
UHC	汚녽줁節わ쉼D	11100111111111011000011011101001101000011001100011101111101111011010101011101111101111011011000001000100	e7fd86e9a198efbdaaefbdb044

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)