Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	彫?音褐??	100100101010010000111111100010011011100110001010100011000011111100111111	92a43f89b98a8c3f3f
EUC-JP	彫?音褐??	110001001010011000111111101100101011101110110011111011000011111100111111	c4a63fb2bbb3ec3f3f
UTF-8	彫렫音褐렢렍	111001011011110110101011111010111010000010101011111010011001111110110011111010001010010010010000111010111010000010100010111010111010000010001101	e5bdabeba0abe99fb3e8a490eba0a2eba08d
UHC	彫렫音褐렢렍	111100001100000110001110101110011110101111100101110010101110100010001110101100111000111010100011	f0c18eb9ebe5cae88eb38ea3

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)