VeryPDF Table Extractor OCR是一款可以支持从各种PDF文件和图像中提取文字的识别软件。可以支持在Windows和Mac OS X系统中运行,支持多种语言,多种文件格式使用,提高文字工作者的工作效率,需要的用户赶快来下载这款工具吧!
软件亮点优势
Mac OS X和Windows用户的两个版本。
VeryPDF Table Extractor OCR官方版支持各种输入输出格式。
支持在线发布。
支持多种语言。
输入文件格式:PDF、BMP、JPG、JPEG、JPE和GIF。
输出文件格式:csv、xls、html、pptx、docx、xlsx、rtf和txt。
将当前页的规则应用于所有其余页。
允许预览原始表和结果表并进行比较。
单击主界面上的文本时,突出显示相应的原始文本。
支持放大和缩小功能。
通过更改阈值,将输入文件的颜色更改为黑白。
清除充满点和斑点的输入文件。
当倾斜角度小于15度时,自动消除输入文件。
将输入文件旋转不同的角度。
提高输入文件的质量。
拆下桌子框架。
删除单元格背景。
选择要OCR的输入文件每页的任何区域。
软件功能说明
从扫描的或普通的PDF文档中提取表
VeryPDF Table Extractor OCR官方版支持使用光学字符识别技术从普通的PDF或扫描的PDF文档中提取表格,效率和质量都很高。在提取的表中,还可以根据需要添加或删除垂直线。
去纸和去纸输入PDF文档
允许在15度范围内倾斜输入的PDF文档。它还支持使用干净的工具去检查充满点和斑点的PDF文档,最后创建一个新的干净文档。
在Windows和Mac OS X系统中运行
专为不同用户设计的Windows和Mac OS X系统。这两个版本的操作方法和界面是相同的。如果你能掌握一个版本,你就可以自由使用另一个版本。
关于文字识别
利用计算机自动识别字符的技术,是模式识别应用的一个重要领域。人们在生产和生活中,要处理大量的文字、报表和文本。为了减轻人们的劳动,提高处理效率
50年代开始探讨一般文字识别方法,并研制出光学字符识别器。60年代出现了采用磁性墨水和特殊字体的实用机器。
60年代后期,出现了多种字体和手写体文字识别机,其识别精度和机器性能都基本上能满足要求。如用于信函分拣的手写体数字识别机和印刷体英文数字识别机。
70年代主要研究文字识别的基本理论和研制高性能的文字识别机,并着重于汉字识别的研究。