Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	崖??浴??	1000101001010010001111110011111110010111100000010011111100111111	8a523f3f97813f3f
EUC-JP	崖??浴??	1011001110110011001111110011111111001101111000010011111100111111	b3b33f3fcde13f3f
UTF-8	崖ㅷ뼹浴녽옦	111001011011010010010110111000111000010110110111111010111011110010111001111001101011010110110100111010111000010110111101111011001001100010100110	e5b496e385b7ebbcb9e6b5b4eb85bdec98a6
UHC	崖ㅷ뼹浴녽옦	111001001111000010100100111001111001011010111100111010011011000110000110111010011001111010100110	e4f0a4e796bce9b186e99ea6

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)