这个第14步就是弹出写文章的地方了,如果网络慢可能会加载不出输入内容的地方的,这就很麻烦了。如果网络慢会导致输入内容框加载的特别慢,一输入,整个页面就崩溃了。这个能怎么办呢,只能加足量的倒计时让事情变的顺利起来了。
所以这个第15步是等待这个内容输入框出来放了六秒,
并且后面跟着的是后台新闻采集动作,不过后面我测试的是他网页嵌套还会变动,所以还要利用采集,把变动的ID给采集回来,这个也是嵌套网页最麻烦的地方了,我这里采集保存为[内容变量]
<% keyID=采集-4546
{万能采集}
<规则>
<要采集的数据>[网页源码]</要采集的数据>
<分割代码>class="cke_toolbar_end"></span></span></span></span><div id="</分割代码>
<结果中含有></结果中含有>
<结果中不含有></结果中不含有>
<开始部分></开始部分>
<结束部分>"</结束部分>
<查找></查找>
<替换为></替换为>
<采集补全><采集结果></采集补全>
<结果存入>变量</结果存入>
<存入>内容变量</存入>
</规则>
<备注>内容变量</备注>
{/万能采集}
%>
比如我这里采回来的结果
万能采集:
采集(1条)存入变量:
[内容变量]=cke_118_contents
这个也是这个脚本的难点所在,内容输入不了,或是输入不进去,就是因为这里在作怪了。
最后发过的链接提交给百度收录,不提交,对不起,百度根本不采集收录的。