java – 提取PDF注释/注释

我们有一个非常复杂的打印工作流程,其中控件是使用Adobe Reader或Adobe Acrobat为生成的PDF文档的草稿版本添加注释和注释.作为工作流程的一部分,应解析带有注释和注释的导入PDF文档,并将注释导入CMS系统(与PDF一起).

问：有没有可靠的工具(首选的Python或Java)来提取这些数据
干净可靠的PDF文件方式？

最佳答案

这段代码应该可以胜任. One of the answers到问题 Parse annotations from a pdf对于让我编写下面的代码非常有帮助.它使用poppler库来解析注释.这是 annotations.pdf的链接.

码

import poppler, os.path

path = 'file://%s' % os.path.realpath('annotations.pdf')
doc = poppler.document_new_from_file(path, None)
pages = [doc.get_page(i) for i in range(doc.get_n_pages())]

for page_no, page in enumerate(pages):
    items = [i.annot.get_contents() for i in page.get_annot_mapping()]
    items = [i for i in items if i]
    print "page: %s comments: %s " % (page_no + 1, items)

产量

page: 1 comments: ['This is an annotation'] 
page: 2 comments: [' Please note ', ' Please note ', 'This is a comment in the text']

安装

在Ubuntu上安装如下.

apt-get install python-poppler

点击查看更多相关文章

转载注明原文：java – 提取PDF注释/注释 - 乐贴网

JAVA c c++go swift javascript Nginx UI/UE 小程序 Python C#php asp GitHub项目推荐

2024年可用、好用、值得推荐的磁力搜索引擎汇总（长期更新）

每日神器 5年前 208781

软件安装 – 如何在Ubuntu中安装geckodriver？

Python 6年前 70

【Mysql】表锁行锁记录锁间隙锁

msyql 4年前 57

python数据分析近年比特币价格涨幅趋势分布

Python 4年前 58

如何从C#中的WinForm.Opacity中排除控件

C# 6年前 82

java：如何将txt文件读取到字符串数组

JAVA 6年前 170

java-PointerByReference不返回值

JAVA 6年前 191

linux – 如何获得sftp版本的远程服务器？

Linux 6年前 42

android – 如何在Realm中设置唯一的主键？

Android 6年前 105

在单个Android应用中使用多个firebase帐户进行Google Analytics

Android 6年前 169

java – 将thymeleaf变量处理为html代码而不是文本

JAVA 6年前 58

python – subprocess.Popen – 没有这样的文件或目录

Python 6年前 38

多个文件中的Python全局变量

Python 6年前 37

在Python中查找并替换(可能)嵌套列表中的元素？

Python 6年前 31

在Mac OS X(10.7)上安装图形工具 – 已经安装了Boost,但不断出现此错误

Python 7年前 47

在CSV文件中使用Python删除行

Python 6年前 96

python – 使用FtpLib获取文件夹大小

Python 6年前 181

java – 提取PDF注释/注释

Python 6年前 82

python – 非法指令：4运行Django时

Python 6年前 32

Pillow-Python中Image.resize和Image.thumbnail有什么区别

Python 6年前 71

python – 从嵌套的json列表中展平Pandas DataFrame

Python 6年前 57

python-Jinja2模板中字典的格式和使用

Python 6年前 160

python-pyinstaller不显示图像和图标

Python 6年前 223

如何通过subprocess.Popen使用自定义环境变量获取PID？

Python 6年前 84

热门推荐

相关推荐