内容提取相关帮助

时间:2010年04月20日 点击:2069

创建任务第四步:内容提取
该步用于从前一步中采到的最终链接列表中,提取出所需要的内容供保存
 



如上图所示:
可以填加多个采集标记,来采网页上的多个需要的内容,
添加采集规则可参考相关帮助:采集规则格式说明过滤规则格式说明内容分页链接采集规则说明

添加规则符加选项说明:
 

1、取规则所有匹配内容,即当采内容的规则匹配到多个内容时(如Tag的提取等)
仅取第一个或是全部保留,可设此初,后面跟着的即是多个保留时的分隔符
2、当前规则匹配不到内容,时跳过整条内容:此处跳过内容指的是该规则采到内容为空时条过当前网址采到的内容

此处设好时可以点 测试采集内容,来检测是否设正确。
这里采到的内容,供最后的保存内容使用。

 

赞助商链接

相关内容

联系我们

联系方式