C# 使用C从Excel读取和提取超链接#
因此,我有一个excel文件,在该文件中有指向PDF的超链接,这些PDF是OCR'd,我想:C# 使用C从Excel读取和提取超链接#,c#,.net,excel,excel-interop,C#,.net,Excel,Excel Interop,因此,我有一个excel文件,在该文件中有指向PDF的超链接,这些PDF是OCR'd,我想: 从excel文件转到超链接PDF 将PDF转换为文本文件 在PDF中搜索某个关键字,然后将该关键字粘贴回excel文件,以引用该关键字所属的行 如果有人能提供如何做到这一点的信息,那将是非常有帮助的。这似乎有点复杂。但我会采取以下方式: 您应该能够在NuGet上找到一个Excel解析器。谷歌似乎也有类似的教程: 关于如何读取PDF文件,也有关于堆栈溢出的帖子,如下所示: 现在,您可以使用步骤1中的库
如果有人能提供如何做到这一点的信息,那将是非常有帮助的。这似乎有点复杂。但我会采取以下方式:
Excel解析器
。谷歌似乎也有类似的教程:
python也可以是您的朋友。您可以首先提取到PDF文件的所有链接,并编写一个小脚本将所有这些PDF文件转换为纯文本,然后用c#打开它 你试过什么?你有什么特别的问题吗?