Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	俑ラ?嵬	10011000110110101000001110001001001111111001101111001010	98da83893f9bca
EUC-JP	俑ラ?嵬	11010000110111001010010111101001001111111101011011001100	d0dca5e93fd6cc
UTF-8	俑ラ뇠嵬	111001001011111110010001111000111000001110101001111010111000011110100000111001011011010110101100	e4bf91e383a9eb87a0e5b5ac
UHC	俑ラ뇠嵬	1110100110110101101010111110100110000111100010001110100011100011	e9b5abe98788e8e3

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)