Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	閻??泣ョ?	111010001000010100111111001111111000101110000011100000111000011100111111	e8853f3f8b8383873f
EUC-JP	閻??泣ョł	1110111111100101001111110011111110110101111000111010010111100111100011111010100111001000	efe53f3fb5e3a5e78fa9c8
UTF-8	閻띾돁泣ョł	1110100110010110101110111110101110011101101111101110101110001111100000011110011010110011101000111110001110000011101001111100010110000010	e996bbeb9dbeeb8f81e6b3a3e383a7c582
UHC	閻띾돁泣ョł	111001111010001010001101111010111000100110010100111010111110100010101011111001111010100110101001	e7a28deb8994ebe8abe7a9a9

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)