Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??n??nB	00111111001111110110111000111111001111110110111001000010	3f3f6e3f3f6e42
SJIS-WIN	??n??nB	00111111001111110110111000111111001111110110111001000010	3f3f6e3f3f6e42
EUC-JP	??n??nB	00111111001111110110111000111111001111110110111001000010	3f3f6e3f3f6e42
UTF-8	천짧n천짧nB	111011001011001010011100111011001010011110100111011011101110110010110010100111001110110010100111101001110110111001000010	ecb29ceca7a76eecb29ceca7a76e42
UHC	천짧n천짧nB	1100001110110101110000101010101001101110110000111011010111000010101010100110111001000010	c3b5c2aa6ec3b5c2aa6e42

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)