Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	央??舜	100010011001101100111111001111111000111101110111	899b3f3f8f77
EUC-JP	央??舜	101100011111101100111111001111111011110111011000	b1fb3f3fbdd8
UTF-8	央띴뜝舜	111001011010010010101110111010111001110110110100111010111001110010011101111010001000100010011100	e5a4aeeb9db4eb9c9de8889c
UHC	央띴뜝舜	1110010011100111100011011110010010001101101000001110001011101111	e4e78de48da0e2ef

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)