这个第十步是让网页拖到最底部,然后手到最顶部,再拖到最底部,这样才可以实现网页的实时加载,和到最后一页,我之所以这样加载拖动,是因为网页不会让您一直拖动加载,他会判断恶意行为,所以就不再加载新的页面,而这里模拟了回滚到顶部再拖到最底部,就可以实现到最后一页的加载。
拖到了最后一页,第17和第18步的意思是清空原来的采集,
再从第18步把我们要的网址采集回来放到列表,清空是不让软件第二次运行的时候重复这些发过的链接,发然这个初始设计时你一直运行着脚本,就算时间长一些,您也要让他把关键字搜出来的链接给发完,不然您下次还会遇到我们发过的链接重复发的情况。