Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????BU	0011111100111111001111110011111100111111001111110100001001010101	3f3f3f3f3f3f4255
SJIS-WIN	??????BU	0011111100111111001111110011111100111111001111110100001001010101	3f3f3f3f3f3f4255
EUC-JP	??????BU	0011111100111111001111110011111100111111001111110100001001010101	3f3f3f3f3f3f4255
UTF-8	묰뫔뫑묿뫛뫐BU	1110101110101100101100001110101110101011100101001110101110101011100100011110101110101100101111111110101110101011100110111110101110101011100100000100001001010101	ebacb0ebab94ebab91ebacbfebab9bebab904255
UHC	묰뫔뫑묿뫛뫐BU	1001001001000111100100011011011010010001101100111001001001001110100100011011101110010001101100100100001001010101	924791b691b3924e91bb91b24255

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)