C# 在PDF中查找文本,其中文本不是';不总是一样的

C# 在PDF中查找文本,其中文本不是';不总是一样的,c#,pdf,itextsharp,C#,Pdf,Itextsharp,我发现这篇文章很有帮助,但我需要对它进行一点扩展,以获得我所需要的- 我的PDF中有一些文本如下: Full Name: Bob Smith 文本“全名”将始终在PDF中,但我不知道“全名”的值是什么,我需要能够找到它 有没有一种方法可以在PDF中搜索特定文本并获取字段值,而不仅仅是查找字段名?我需要能够得到“鲍勃·史密斯”或该领域的任何东西。“Bob Smith”这个名字将在每个PDF文件中的相同位置,并且在“全名”字段后以相同数量的空格开始,我只是不知道如何捕获“Bob Smith”我正

我发现这篇文章很有帮助,但我需要对它进行一点扩展,以获得我所需要的-

我的PDF中有一些文本如下:

Full Name:  Bob Smith
文本“全名”将始终在PDF中,但我不知道“全名”的值是什么,我需要能够找到它

有没有一种方法可以在PDF中搜索特定文本并获取字段值,而不仅仅是查找字段名?我需要能够得到“鲍勃·史密斯”或该领域的任何东西。“Bob Smith”这个名字将在每个PDF文件中的相同位置,并且在“全名”字段后以相同数量的空格开始,我只是不知道如何捕获“Bob Smith”

我正在使用ABCPDf 但逻辑可能是一样的

使用GETTEXT之类的方法将整个文档转换成字符串
for(int i=0;i)你一直在说“field”,这听起来像是在表单中搜索文本字段。是这样吗?还是你只是在用文档搜索文本。如果你的问题是“iTextSharp是否有搜索特定单词的功能”我可以告诉你,没有。你可以提取文本,但这取决于你在提取的文本中执行搜索。此外,我建议查看此处显示的LocationTextExtractionsStrategy