Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	議臀??槨運	10001011011000111110010001011100001111110011111110011110110110001000100101011110	8b63e45c3f3f9ed8895e
EUC-JP	議臀??槨運	10110101110001001110011110111101001111110011111111011100110110101011000110111111	b5c4e7bd3f3fdcdab1bf
UTF-8	議臀렭폄槨運	111010001010110110110000111010001000011110000000111010111010000010101101111011011000111110000100111001101010011110101000111010011000000110001011	e8adb0e88780eba0aded8f84e6a7a8e9818b
UHC	議臀렭폄槨運	111011001010000111010100111010111000111010111010110001101110111111001110101010101110101010100001	eca1d4eb8ebac6efceaaeaa1

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)