Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????LB	00111111001111110011111100111111001111110100110001000010	3f3f3f3f3f4c42
SJIS-WIN	鉉懃ｷ貞竅LB	1110011111101001100111001110011110110111100100101110010111100010100000010100110001000010	e7e99ce7b792e5e2814c42
EUC-JP	鉉懃ｷ貞竅LB	111011101110101111011000111010011000111010110111110001001110011111100011111000010100110001000010	eeebd8e98eb7c4e7e3e14c42
UTF-8	鉉懃ｷ貞竅LB	1110100110001001100010011110011010000111100000111110111110111101101101111110100010110010100111101110011110101011100001010100110001000010	e98989e68783efbdb7e8b29ee7ab854c42
UHC	鉉懃?貞竅LB	1111101011101000110100001100010000111111111011111111011011010000101010110100110001000010	fae8d0c43feff6d0ab4c42

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)