Warning: file_get_contents(/data/phpspider/zhask/data//catemap/1/asp.net/33.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
如何在c#.net web应用程序中读取pdf文件中的文本_C#_Asp.net_.net_Pdf - Fatal编程技术网

如何在c#.net web应用程序中读取pdf文件中的文本

如何在c#.net web应用程序中读取pdf文件中的文本,c#,asp.net,.net,pdf,C#,Asp.net,.net,Pdf,我正在做一个项目,其中有一个功能需要与PDF实现 我想在我的c#.net项目中阅读PDF文件的文本 有人知道怎么做吗?也许可以使用pdfLib 从 PDFlib TET PDF IFilter(Windows上的企业PDF搜索)从PDF文档中提取文本和元数据,并使其可用于Windows上的搜索和检索软件 尝试此库,非常易于使用,并且完全符合您的需要: 请查看以下链接: 及 希望他们能引导你找到正确的方向。简短的回答,除非你正在生成pdf并正确执行,否则答案是否定的 Pdf文件的生成方式与发送

我正在做一个项目,其中有一个功能需要与PDF实现

我想在我的c#.net项目中阅读PDF文件的文本


有人知道怎么做吗?

也许可以使用pdfLib

PDFlib TET PDF IFilter(Windows上的企业PDF搜索)从PDF文档中提取文本和元数据,并使其可用于Windows上的搜索和检索软件


尝试此库,非常易于使用,并且完全符合您的需要:


请查看以下链接:


希望他们能引导你找到正确的方向。

简短的回答,除非你正在生成pdf并正确执行,否则答案是否定的


Pdf文件的生成方式与发送到打印机的方式类似。并不是所有的文本都可读,关于文本的信息可以任意存储。另外,一些程序可能会以矢量或位图格式保存文本。

我非常希望使用PdfTextStripper的getText()方法。要实现这一点,您可以查看以下url:


你也在写,想对你的答案打分。谢谢谢谢,回答正确。我是如何从First链接以及发布的链接中得到解决方案的,这些链接肯定很有用,但你说的没错,并不是所有的文本都可以阅读。我有一些PDF的其中有'矢量文本',有任何图书馆读这些吗?你需要光栅的PDF(将其转换为图像),然后使用一些OCR软件读取图像的文本。这将不是非常可靠,可能无法扩展。简言之,不是真的。