Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??o????	00111111001111110110111100111111001111110011111100111111	3f3f6f3f3f3f3f
SJIS-WIN	??o?普?使	001111110011111101101111001111111001010110000001001111111000111001100111	3f3f6f3f95813f8e67
EUC-JP	??o?普?使	001111110011111101101111001111111100100111100001001111111011101111001000	3f3f6f3fc9e13fbbc8
UTF-8	렻렊o렺普늙使	11101011101000001011101111101011101000001000101001101111111010111010000010111010111001101001100110101110111010111000101010011001111001001011110110111111	eba0bbeba08a6feba0bae699aeeb8a99e4bdbf
UHC	렻렊o렺普늙使	10001110110000111000111010100001011011111000111011000010110111001100010110110100110001001101111011000101	8ec38ea16f8ec2dcc5b4c4dec5

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)