Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	渟紗?提?弟	10011111110110011000111011010001001111111001001011110001001111111001001011101101	9fd98ed13f92f13f92ed
EUC-JP	渟紗?提?弟	11011110110110111011110011010011001111111100010011110011001111111100010011101111	dedbbcd33fc4f33fc4ef
UTF-8	渟紗색提렡弟	111001101011100010011111111001111011010010010111111011001000001110001001111001101000111110010000111010111010000010100001111001011011110010011111	e6b89fe7b497ec8389e68f90eba0a1e5bc9f
UHC	渟紗색提렡弟	111011111110010111011110111010011011101111110110111100001010101110001110101100101111000010101001	efe5dee9bbf6f0ab8eb2f0a9

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)