Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???TB	0011111100111111001111110101010001000010	3f3f3f5442
SJIS-WIN	綺場栗TB	1110001101011001100011111110101010001100010010010101010001000010	e3598fea8c495442
EUC-JP	綺場栗TB	1110010110111010101111101110110010110111101010100101010001000010	e5babeecb7aa5442
UTF-8	綺場栗TB	1110011110110110101110101110010110100000101101001110011010100000100101110101010001000010	e7b6bae5a0b4e6a0975442
UHC	綺場栗TB	1101000110111011111011011101111011010111110010100101010001000010	d1bbedded7ca5442

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)