八爪鱼网页数据采集工具是一款非常好用的且实用的网络信息提取工具,不仅使用简单,而且功能强大:点击,登陆,翻页,甚至识别验证码,当网页出错误,或者多套模版完全不一样的时候,还可以根据不同情况做不同的处理。喜欢的朋友快来下载吧!
八爪鱼网页数据采集工具特色优势:
规则配置很简单:
输入网址拖拉控件即可配置任务
点击翻译即可自动一页一页往下翻
点击提取元素机子的提取同类型元素
还支持预设输入信息进行账号登录或者信息搜索
还支持云采集:
多云端服务器同时帮你采
十万百万数据轻松到手
有效防封IP
支持定时启动
采集数据表格化:
采集数据表格化
列字段可以自由配置
支持导出数据库,网站,EXCEL,文本等多种导出方式
更支持直接导入wordprsee,discuz,dede等多种论坛博客网站
最重要的是:免费!!!
怎样从单个网页中提取信息:
首先打开八爪鱼采集器→点击快速开始→新建任务,进入到任务配置页面:
选择任务组,自定义任务名称和备注:
上图配置完毕之后,选择下一步,进入到流程配置页面,往流程设计器中拖入一个打开网页的步骤:
选中浏览器中的打开网页步骤,在右边的页面URL中输入网页URL并点击保存,系统会在软件下方的浏览器中自动打开对应网页:
下面进行数据字段的提取,点击浏览器中需要提取的字段,然后在弹出的选择对话框中选择抓取这个元素的文本:
上述操作之后,系统会在页面的右上方显示我们将要抓取的字段:
接下来配置页面中其他需要抓取的字段,配置完成之后修改字段名称:
修改完成之后点击上图中的保存按钮,再点开图中的数据字段可以看到,系统将会显示最终的采集列表:
点击上图中的下一步→下一步→启动单机采集(调试模式),进入到任务检查页面,以确保任务的正确性;
点击开始单机采集,系统将会在本地执行采集流程并显示最终采集的结果;
安装提示:
本软件需要.NET3.5 SP1支持,Win 7已经内置支持,XP系统需要安装,软件会在安装时自动检测是否安装了.NET 3.5 SP1,如果没有安装则会自动从微软官方在线安装。