Pdf 使用iText从Foxit Reader文本框注释中提取数据

Pdf 使用iText从Foxit Reader文本框注释中提取数据,pdf,itext,itext7,Pdf,Itext,Itext7,假设您有一个pdf文档,其中包含以下无OCR文本: “我是山姆,今年28岁,明天是2018年4月18日。” 是否可以在“Sam”、“28”和“2018年4月18日”的正下方插入表单控件,以便用户可以准确地在表单控件中键入这些信息,并且编程代码可以读取表单控件中的这些信息 我能做到吗?或者更简单的工具 编辑1:下面我将努力使我的目标更加明确(对不起,我的英语很差)。 在我的工作中,我必须从没有OCR的旧扫描文档中提取大量信息。对其应用OCR不是一个选项。我想做的是:(a)打开pdf文档并开始阅读。

假设您有一个pdf文档,其中包含以下无OCR文本:

“我是山姆,今年28岁,明天是2018年4月18日。”

是否可以在“Sam”、“28”和“2018年4月18日”的正下方插入表单控件,以便用户可以准确地在表单控件中键入这些信息,并且编程代码可以读取表单控件中的这些信息

我能做到吗?或者更简单的工具

编辑1:下面我将努力使我的目标更加明确(对不起,我的英语很差)。

在我的工作中,我必须从没有OCR的旧扫描文档中提取大量信息。对其应用OCR不是一个选项。我想做的是:(a)打开pdf文档并开始阅读。(b) 每次我发现我必须使用的信息,如数据出生,我都希望在其附近插入/应用/放置/创建/设置一个文本框(例如,下面),然后在文本框中键入该日期出生。(c) 在完成插入我想要的所有文本框(姓名、年龄、出生日期、收入等)并在其中键入从pdf中读取的信息的任务后,我希望能够在编程代码的文本框中处理所有这些信息,例如c


使用iText,可以提取在Foxit Reader pdf标注功能中插入的注释。正如mkl在问题注释中所回答的,这些Foxit阅读器注释“包含在注释词典的内容条目中。”

使用iText 7,您可以提取如下文本框注释:

try(PdfReader-PdfReader=newpdfreader(“HelloFOXIT.pdf”);
PdfDocument PdfDocument=新PdfDocument(pdfReader)){

对于(int pageNr=1;pageNr),我不确定我是否理解您想要的内容。您能再举例说明一下吗?您好,mkl,我编辑了文本以使其更清晰,并添加了一个屏幕截图。“我打开pdf文档并开始阅读。”-您想使用哪个程序打开PDF?您可以创建哪种注释,取决于该程序提供的内容。我可以使用编程语言来读取PDF的文本框,其中使用Foxit Reader文本框功能插入了文本框注释吗?这就足够了。请共享一个示例PDF。我非常确定我的答案是的,iText可以提取那些文本框评论,但我想先检查一下。理论上,Foxit Reader可能会把所有东西都弄得乱七八糟……我不相信,但我看到过更奇怪的事情。