Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	?ゃ?油ε?	001111111000001011100001001111111001011011111011100000111100001100111111	3f82e13f96fb83c33f
EUC-JP	?ゃ?油ε?	001111111010010011100011001111111100110011111101101001101100010100111111	3fa4e33fccfda6c53f
UTF-8	閭ゃ굞油ε♤	1110111110100110100001101110001110000010100000111110101010110101100111101110011010110010101110011100111010110101111000101001100110100100	efa686e38283eab59ee6b2b9ceb5e299a4
UHC	閭ゃ굞油ε♤	111001101010110110101010111000111000001010000110111010101111101010100101111001011010001010111011	e6adaae38286eafaa5e5a2bb

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)