EditorTools3是一款功能强大的免费的全自动信息采集软件,能够帮助用户实时监控采集指定站点内容,支持一键下载文字图像视频音频等文件,能够24小时无人监管自动采集,有需要的用户不要错过了,欢迎下载使用!
软件特色
1、开机自动运行ET:启动电脑进入系统后,自动运行ET程序;
2、ET启动后自动工作:ET启动运行后,自动执行上一次使用ET时勾选的工作方案,只有启用本项,才会自动保存当前勾选的工作方案;
3、启动后最小化:ET启动后,隐藏主窗口,只显示托盘图标;
4、忽略规则首尾空白:启用本项后,采集配置中的各个规则将自动去除首尾的空格、回车、换行等空白字符,以避免用户多输入空格或换行导致规则分析失败;如果用户需要利用空格或换行来确定规则的首尾边界,则请取消勾选;
5、方案执行间隔时间:在进行自动工作、选择多个方案时,一个方案的当前列表采集完后,间隔多久更换采集下一个方案;
6、访问网络超时时间:设定在访问网络时超过多久无响应则强制断开;
7、访问网络重试次数:设定在访问网络时遇到失败的自动重试次数,例如采集网页、下载文件、FTP上传等,这是2.2版中新增功能;
8、访问网页失败后自动重启ET:设定在访问网页失败一定次数后自动重启ET,以解决一些可能出现网络阻塞导致无法继续正常工作的问题;本功能仅在自动工作时生效,停止自动工作将重置失败计数,重试访问不计数;这是2.3.7版中新增功能;
软件特点
【全自动无人值守】
无需人工值守,24小时自动实时监控目标,实时高效采集,昼夜不停为您提供内容更新。满足长期运行需求,将您从繁重工作中解脱
【适用广泛】
最全能的采集软件,支持任意类型网站采集,适用率高达99.9%,支持发布到所有类型网站程序,更可以采集本地文件,免接口发布。
【信息随心所欲】
支持信息自由组合,通过强大的数据整理功能对信息深度加工,创造全新内容
【任意格式文件下载】
不论静态或动态,不论是图片、音乐、电影、软件,又或者是PDF文档、WORD文档,甚至种子文件,只要你想
【伪原创】
高速同近义词替换、多词随机替换、段落随机排序,助力内容SEO
【无限多级页面采集】
无论垂直方向多层页面,还是平行方向复数分页,抑或AJAX调用页面,为你轻松采集
【自由扩展】
开放的接口模式,可以自由二次开发,自定义任何功能,实现所有需求
软件功能
设置劫持特征代码;
很多地区的电信宽带用户在上网时,会被强行在访问信息中,用一些代码替换访问信息,让用户只能通过代码中的框架查看原本要访问的网页,这通常用来显示电信的广告或进行其他隐秘的动作,这种行为被称为劫持浏览器;当出现这种情况时,ET所采集的源码也只能得到这些劫持代码,而不是要采集的网页源码
设置UserAgent;
网站通过userAgent来判断当前用户使用的是什么浏览器,并根据这个浏览器能够支持的情况提供相应的功能。浏览器在访问一个网页时通常会传送一个识别字串告诉网站它是什么浏览器软件,我们访问的部分网站会对UserAgent进行限制,我们可以在基本设置中修改UserAgent,也可以点击'获取本机UserAgent'按钮获得本机的IE默认UserAgent
设置支持语言;
采集某些网页时,网站可能会检查支持的语言,用户可以在此调整。
锁定设置
此功能用于设置打开各个配置窗口时的密码,当设置了锁定密码后,使用 菜单-锁定 功能,即可在用户离开电脑后,防止他人访问操作各项配置。
数据项设置
数据项用于定义从采集页面获取的各项信息,除[标题]、[缩略图]、[文章网址](即发布规则中的[文章网址])这三项数据可在列表设置页获取外
数据项属性编辑区
[缩略图]、[标题]、[正文]、[文章网址]四个基本数据项的名称不能修改。
其中[文章网址]数据项的取值为列表规则中文章网址合成的结果。
[标题]数据项对应列表分析中的[文章标题]标记,默认取值为列表分析获取的文章标题。
[缩略图]数据项对应列表分析中的[缩略图]标记,默认取值为列表分析获取的缩略图。
功能介绍
适用广泛
比较全能的采集软件,支持任意类型网站采集,适用率高达99.9%,支持发布到所有类型网站程序,更可以采集本地文件,免接口发布。
信息随心所欲
支持信息自由组合,通过强大的数据整理功能对信息深度加工,创造全新内容
任意格式文件下载
不论静态或动态,不论是图片、音乐、电影、软件,又或者是PDF文档、WORD文档,甚至种子文件,只要你想
伪原创
高速同近义词替换、多词随机替换、段落随机排序,助力内容SEO
无限多级页面采集
无论垂直方向多层页面,还是平行方向复数分页,抑或AJAX调用页面,为你轻松采集
自由扩展
开放的接口模式,可以自由二次开发,自定义任何功能,实现所有需求
软件内置了包括discuzX,phpwind,dedecms,wordpress,phpcms,帝国cms,动易,joomla,pbdigg,php168,bbsxp,phpbb,dvbbs,typecho,emblog等大量常用系统的范例。
主要优势
1、工作记录:
该栏记录ET的每一步工作过程及状态,包括目录采集和文章处理两大部分,我们通过工作记录可以了解该次采集执行是否正确完成,或是出现了什么问题;当出现问题时,可以根据提示、结合信息栏的其他反馈内容,用户可以迅速准确地找到故障原因并予解决。
2、采集源码:
此栏显示执行过程中所采集的文章列表页、文章页面、文章分页等的网页源代码,利用此栏源代码,可以方便的进行规则测试、提供规则定制依据。
注意,某些网站会根据不同来访浏览器而显示不同的源代码,所以,ET的采集规则定制时,应以此栏的源代码为准,例如采集规则范例中的‘SMF 1.1.5’,其网站通过IE访问和ET采集获取到的源码就有区别。
3、分析数据:
此栏显示文章处理过程中的各个数据项信息,从分析到的原始代码,到整理后的代码,再到经过URL修正后的代码,用户通过查看此栏,可以了解设置的数据项分析规则是否准确、整理组规则是否完善、最终的信息是否符合自己的要求。
例如:当工作记录栏提示错误‘正文字数大于或小于发布设置’时,我们可以查看本栏的‘正文’数据项,了解具体是大于还是小于发布设置,原因是正常还是因为整理组设置不当,从而调整各个设置。
4、发送代码:
此栏显示ET向发布网站发送的数据,包括文章检查部分和文章发布部分;
用户可以通过此栏信息了解通过一系列分析、整理操作,最终向发布网站提交的数据,用以检查自己的采集规则数据项、发布规则的参数设置等是否正确、完整。
5、返回信息:
此栏显示ET向发布网站发送数据后发布网站的反馈,包括文章检查反馈和文章发布反馈;
通过查看此栏,我们可以清晰的了解当采集过程出现问题时的大部分原因。
一些接口在返回错误信息时,信息可能是HTML代码,不熟悉HTML代码的用户阅读比较吃力,点击WEB浏览按钮,可以在操作系统默认浏览器中方便的查看它们