Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???A??	001111110011111100111111010000010011111100111111	3f3f3f413f3f
SJIS-WIN	??船A癌洩	001111110011111110010001010001000100000110001010111000001000100101101011	3f3f9144418ae0896b
EUC-JP	??船A癌洩	001111110011111111000001101001010100000110110100111000101011000111001100	3f3fc1a541b4e2b1cc
UTF-8	卨蟬船A癌洩	11100101100011011010100011101000100111111010110011101000100010001011100101000001111001111001100110001100111001101011010010101001	e58da8e89face888b941e7998ce6b4a9
UHC	卨蟬船A癌洩	1110000011011001111000001101000111100000110011110100000111100100110111111110000011011101	e0d9e0d1e0cf41e4dfe0dd

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)