Parsing 解析XPS或PDF并将数据插入Word模板?

Parsing 解析XPS或PDF并将数据插入Word模板?,parsing,pdf,xps,Parsing,Pdf,Xps,因此,我可以选择从数据库发送文档,以PDF或XPS格式打印。我需要能够从这些格式中提取特定的数据,例如姓名、日期等,并将这些数据插入word模板。word模板不可编辑。您只能在字段内键入。。。每个字段前面都有一个标题,例如名称、dob等 基本上,我需要能够自动将信息从PDF或XPS文件传输到word模板 我对C++、Python和java很熟悉。所以我没有语言偏好——不管什么都能完成任务 你能给我一个办法吗?我很难找到从这些文件类型中解析/提取数据的方法,以及哪种文件类型更适合。我完全不知道如何

因此,我可以选择从数据库发送文档,以PDF或XPS格式打印。我需要能够从这些格式中提取特定的数据,例如姓名、日期等,并将这些数据插入word模板。word模板不可编辑。您只能在字段内键入。。。每个字段前面都有一个标题,例如名称、dob等

基本上,我需要能够自动将信息从PDF或XPS文件传输到word模板

我对C++、Python和java很熟悉。所以我没有语言偏好——不管什么都能完成任务

你能给我一个办法吗?我很难找到从这些文件类型中解析/提取数据的方法,以及哪种文件类型更适合。我完全不知道如何在Word模板中自动填充字段

哦,忘了提一下,这是在Windows7(也许是8,但大部分是7)机器上


提前感谢您的帮助

这是为任何有同样问题的人准备的,我就是这样做的:


我使用PDFBox()解析文档并提取所需的数据,然后使用docx4j()将数据插入word模板。这两种工具都是令人难以置信的工具,而且都有优秀的社区,几乎可以立即提供帮助。

在本网站上搜索
[c++]parse pdf
[c++]word automation
,然后尝试谷歌或必应。这个问题的范围太广了。这里的问题应该是具体的,每个帖子只能回答一个问题。你问了三个问题(解析PDF、解析XPS和填充单词模板),它们都太模糊了,无法回答。@Ken White听起来不错,谢谢。