Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	臟?艶??	11100100011001100011111110001001100100000011111100111111	e4663f89903f3f
EUC-JP	臟?艶??	11100111110001110011111110110001111100000011111100111111	e7c73fb1f03f3f
UTF-8	臟뢄艶쀯풊	111010001000011110011111111010111010001010000100111010001000100110110110111011001000000010101111111011011001001010001010	e8879feba284e889b6ec80afed928a
UHC	臟뢄艶쀯풊	11101101111101001000111011111110111001101111110110010111111011111011111010010000	edf48efee6fd97efbe90

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)