当我们点测试动作的时候,这里井井有条的显示一个一个公司的名号,然后我们找到开始部分,和结束部分来,因为我们采集的目标是网址,所以我们这里把不是网址的代码找一个开始屏蔽掉,
一般采集网址,分割找对了,那开始和结束固定都是这样的。href="开始代码,结束代码是双引号“
有了这样的做法,我们就可以把这个所有分类的网址采集下来。
采集的网址保存在哪里,数组可以存放,列表的网址可以存放,数组存放的话,就不用加清空网址,他会临时储存在电脑的内存里面,当我们调用的时候,就可以利用数组执行,进行一步一个调用出来操作,这里我们还是传统一些,放在了这个网址列表,效果是一样的,而且这个列表是可以保存进度的,比如你有重要的事要处理,可以先暂停,他就会接着进程去,或是电脑突然没有电了,您重打开来,他也是按上次进行的进程去的。数组的话,则不能,你电脑都没有电了,内存记忆自然就没有了,不过数组存储是比写入列表的数据来的快速的。