现在越来越多人养一些新闻正规站,然后做蜘蛛池用,确实,这类ZBLOG博客程序,更加适合简简单单才是真的人优化起来。现在这类网站有一个非常好的思路,就是专业专用,地方门户用,新闻网站专用,自媒体专用站,都是用这个先原创一个月文章五篇,等达到了秒收程度,这个网站就不用去原创了,发啥都秒收录,然后用软件更新网站仍然可以秒收录新闻。只要固定更新,再在首页放点发过的链接,其实秒收录的份,这个方法供动手能力强的人是一个很不错的思路,不然你会看着别人收录,自己0收录也是蛮郁闷的事。也许前期很累,但后期养起了一些站后,就轻轻松松发帖秒收录了。
今天说的这个脚本,是网站后期专用的,你前期用的话,效果有,但这就和站群没有两样,看机率,有的网站收录好,有的网站被百度不闻不问,所以一个月原创的作文,还是很需要的,需要自己劳累的更新起来几个网站,然后才会有好的结果。 这个是发帖的时候,你调用几条新闻内容
这个内容4列表就是对应上面这个发帖时调用条数据控制数量,您可以一条,也可以五条,也可以十条这样调用成一篇文章的内容。
我们可以看一下这个下面这个截图,介绍了网站更新速度,每一个网站采集留下几条新的新闻,还有一共在自己网站更新几帖就重新清空内容4这个列表,重新运行采集动作运行起来,这一切都是自动的,全部有调整好测试运行过。
脚本虽然不复杂,但如果您能把这个脚本看明白,几乎所有采集都可以搞掂了,具体采集教程链接可以和我拿,然后拿这个网站练手,几乎就全部会了。
我这里是采集保存为数组的,这样可以处理完了才入库,比如说我后面这里可以加上新闻字数限制,软件是有的,不足多少次,就不入到内容4这个列表,这个脚本没有这个限制,但是这个脚本有条数限制入库
如上图所录,这个数字126就是这个网页采回来的总条数,如果我们不限制,往往会采到很多旧的新闻,所以我们这里用了数组循环。
这个数组的意思是让你能处理采回来的条数,
或是你可以转拼音,可以伪原创入库,我这里说的入库,就是存到内容4这个列表中。
这里采集新闻网站,
所有都是有一个逻辑判断,这个判断很细心,这个序号这个的意思在这里是表示:
[
[
[
[
前面的序号就是这个1 2 3 4这样子排列的第几条。
对应这个方框里的意思就是当你等于前面这个数字1 2 3 4 5的时候,他就会执行这个跳转,这样子就会能达到自己留下多少条新闻的意思。
不但如此,这个数组循环还有一个作用,就是当你采集留下的数字大于数组采集回来的条数的时候,也不影响使用,比如你采贸留下几条里填了100,而采回来的只有10条,那当他循环10条数组的时候,他会自动跳出数组,而不会一直运行一百次循环入库,这也是数组很大的作用之处了。
这个数组采集回来所有新闻,一共有106步,虽然采集的时候比较简单,但有一点差错就要全改,做起来还是很烦琐的。如果您站不大,可以只有前面几个网站,在访问网址那里断开就行了。
这个源码可以放在任何脚本里使用的。
脚本封面截图:
自动采集新闻下载脚本: