分类
大小:100.52MB
语言:中文系统:
类别:PDF处理时间:2020-04-26
PDFlux中文版是一款PDF文档提取工具,能够满足你对PDF的所有需求。它可以进行格式转换,识别表格。而且也内置了浏览器插件,能够简化PDF处理步骤,直接打开文档,非常的智能化。
1、表格识别
精准识别无线框表格
精准识别复杂排版页面的表格
精准识别表格内部单元格合并
跨页表格自动合并
支持扫描件的表格识别:去除印章、角度矫正
2、格式转换
将PDF转化为Word、Excel、HTML等格式
将PDF转化为EPUB、MOBI等电子书格式,可以在手机或Kindle等电纸书上阅读
精准保留文本段落、表格等内容块信息
精准识别文档的章节目录结构
支持复杂排版的PDF文档的转换
3、手机阅读
将PDF转化为易于手机阅读的格式
微信小程序中按目录结构跳转、字体缩放
微信小程序文档分享
4、浏览器插件
增加”在PDFlux中打开“按钮,直接打开PDF文件
一键打开PDF,省去下载、改名、选择等繁琐步骤
快捷查看历史记录,多种方式访问
支持巨潮网、上交所、港交所,会支持更多网站
5、SaaS服务
提供一套完整易用的REST API,供计算机调用,让您把PDF复杂格式抛诸脑后
将PDF文档解析为文本段落、表格、图片等内容块的序列,保留原文档的阅读顺序
支持中英文多栏复杂排版的PDF文档解析,跨栏和跨页内容块智能自动合并
智能识别表格的内部结构:单元格合并,单元格文字的对齐方式、缩进、颜色、加粗、斜体等样式信息,跨页和跨栏表格智能合并单元格文字
智能识别文档的目录结构,支持多达10个层级,长文档信息抽取必不可少
支撑后续各类文档智能的应用:PDF文档全文检索、文档级别信息抽取等
1、识别表格
识别表格和识别本页表格功能相同,点击后系统自动识别本页内的表格和其他元素。
批量识别表格,点击后会打开缩略图,缩略图左上角批量识别按钮默认置灰,按住鼠标左键框选缩略图后点击批量识别按钮,系统自动识别已选中的页面。
2、调整/删除表格
添加删除表格内线:点击对应按钮,然后把鼠标移动到需要添加或删除线的位置,单击鼠标左键,即可添加或删除线。
删除表格:点击删除表格按钮,然后把鼠标移动到需要删除的表格上方,单击鼠标左键,即可删除对应表格。
3、合并跨页表格
系统可以自动识别合并跨页表格,去除多余表头、合并跨页单元格,并输出成一个表格。如果未能自动合并或错误合并,可以通过表格链按钮进行操作。
4、批量复制
点击批量复制按钮后,使用鼠标左键单击选中需要复制的段落和表格后,点击顶部浮框中的复制按钮即可粘贴到Excel或Word中。
5、解析公式
进入“系统”→“设置”中,勾选“启用解析公式”;
在工具栏中点击激活 解析公式 按钮,框选需要解析的公式后,点击右侧 解析公式 按钮等待解析完成;
打开Latex编辑器并粘贴,就可以看到结果。
1. 修复个别扫描件旋转异常、Toolbar交互异常
2. 修复个别扫描件单元格内容折行、对齐方式异常
3. 优化识别表格交互和相关提示信息