C# 使用C从Excel读取和提取超链接#

C# 使用C从Excel读取和提取超链接#,c#,.net,excel,excel-interop,C#,.net,Excel,Excel Interop,因此,我有一个excel文件,在该文件中有指向PDF的超链接,这些PDF是OCR'd,我想: 从excel文件转到超链接PDF 将PDF转换为文本文件 在PDF中搜索某个关键字,然后将该关键字粘贴回excel文件,以引用该关键字所属的行 如果有人能提供如何做到这一点的信息,那将是非常有帮助的。这似乎有点复杂。但我会采取以下方式: 您应该能够在NuGet上找到一个Excel解析器。谷歌似乎也有类似的教程: 关于如何读取PDF文件,也有关于堆栈溢出的帖子,如下所示: 现在,您可以使用步骤1中的库

因此,我有一个excel文件,在该文件中有指向PDF的超链接,这些PDF是OCR'd,我想:

  • 从excel文件转到超链接PDF
  • 将PDF转换为文本文件
  • 在PDF中搜索某个关键字,然后将该关键字粘贴回excel文件,以引用该关键字所属的行

  • 如果有人能提供如何做到这一点的信息,那将是非常有帮助的。

    这似乎有点复杂。但我会采取以下方式:

  • 您应该能够在NuGet上找到一个
    Excel解析器
    。谷歌似乎也有类似的教程:

  • 关于如何读取PDF文件,也有关于堆栈溢出的帖子,如下所示:

  • 现在,您可以使用步骤1中的库更新excel文件

  • 所以最后你必须寻找能让你的生活更轻松的图书馆。查阅他们的文档,你的生活会变得更轻松

    实际上,如果可以使用已有的代码,就不需要编写那么多

    顺便说一下,在纯文本中搜索关键字时,请查看正则表达式。
    python也可以是您的朋友。您可以首先提取到PDF文件的所有链接,并编写一个小脚本将所有这些PDF文件转换为纯文本,然后用c#打开它

    你试过什么?你有什么特别的问题吗?