Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???h???	00111111001111110011111101101000001111110011111100111111	3f3f3f683f3f3f
SJIS-WIN	?審?h?審?	001111111001000001010010001111110110100000111111100100000101001000111111	3f90523f683f90523f
EUC-JP	?審?h?審?	001111111011111110110011001111110110100000111111101111111011001100111111	3fbfb33f683fbfb33f
UTF-8	룶審∼h룶審∼	11101011101000111011011011100101101011111010100111100010100010001011110001101000111010111010001110110110111001011010111110101001111000101000100010111100	eba3b6e5afa9e288bc68eba3b6e5afa9e288bc
UHC	룶審∼h룶審∼	10001111101010111110001111111011101000011010110101101000100011111010101111100011111110111010000110101101	8fabe3fba1ad688fabe3fba1ad

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)