C# 为未选择副本的安全pdf编制索引

C# 为未选择副本的安全pdf编制索引,c#,vb.net,pdf,indexing,ifilter,C#,Vb.net,Pdf,Indexing,Ifilter,我到处找了。也许我不知道该找什么 我需要能够索引和搜索“安全”PDF。这些PDF已选择“无副本”属性,并已锁定。这意味着没有用户名和密码就无法复制PDF的内容。IFilter尊重这些设置,不允许对PDF进行索引 我正在寻找一种在我的服务器上使用aspx.net索引和搜索这些PDF文件的方法。我似乎被以下其中一个问题困住了: 我拥有打开这些PDF文件所需的凭证,以获得对内容的“复制”访问权 为我的工具提交PDF时,需要提交两项: 复制-和- PDF副本 将完整内容复制到PDF的元数据中,或者至少复

我到处找了。也许我不知道该找什么

我需要能够索引和搜索“安全”PDF。这些PDF已选择“无副本”属性,并已锁定。这意味着没有用户名和密码就无法复制PDF的内容。IFilter尊重这些设置,不允许对PDF进行索引

我正在寻找一种在我的服务器上使用aspx.net索引和搜索这些PDF文件的方法。我似乎被以下其中一个问题困住了:

  • 我拥有打开这些PDF文件所需的凭证,以获得对内容的“复制”访问权
  • 为我的工具提交PDF时,需要提交两项: 复制-和- PDF副本
  • 将完整内容复制到PDF的元数据中,或者至少复制一些关键字。 我还没有研究这里可能涉及什么样的风险。 这对作者来说意味着额外的一步
  • 解决方案一和解决方案二将意味着维护一个副本。。。在服务器上或数据库中,并以编程方式参考实际下载。有人想出了解决这个问题的办法吗?我更喜欢索引功能,因为它意味着没有重复的内容。如果PDF元数据能够处理那么多内容,并且安全性仍然完好,那么解决方案3就很有吸引力。我还想知道如何通过编程访问PDF,通过C#或VB,我可以使用凭据获得访问权限。。。但看起来我可能被卡住了


    这是我找到另一个解决方案的最后努力。任何帮助都将不胜感激。

    如果您有这些文件的用户名和密码,那么您是否可以打开这些文件并从中提取文本

    然后,您将能够从提取的数据中构建索引

    ,我参与的库可以为您打开受密码保护的文件。它还可以提取文本。文本可以提取为纯文本或格式化文本,也可以按单词或字符分割

    请看以下样品:


    我最终选择了一个完全不同的解决方案。我喜欢使用MS的索引的想法,但是使用SQL和让上传PDF的用户将关键字或PDF内容粘贴到文本框中变得更加容易了。然后SQL可以索引该“列”和bamm。。。搜索引擎完成其余的工作

    谢谢大家抽出时间来考虑这个问题。