读取包含所有格式信息的现有PDF文件

读取包含所有格式信息的现有PDF文件,pdf,Pdf,我想阅读一个现有的PDF文件,不仅要获取文本,还要获取格式信息,如:字体(粗体、斜体…)和段落。。。有没有这样的代码库,是开源的还是商业的 我在Windows上,喜欢C#库,但C/C++也是可以接受的。在这一点上,我会附和Meyers先生。它们似乎有很多;在您喜爱的搜索引擎中搜索“pdf解析器库”(以及您的语言) 一些热门歌曲: (对于.NET,有几个) 请注意,如果要编辑现有PDF,可能需要阅读以下内容: 我非常推荐 pdflib()。 它的商业版,但它也有一个精简版,你可以免费使用私人

我想阅读一个现有的PDF文件,不仅要获取文本,还要获取格式信息,如:字体(粗体、斜体…)和段落。。。有没有这样的代码库,是开源的还是商业的


我在Windows上,喜欢C#库,但C/C++也是可以接受的。

在这一点上,我会附和Meyers先生。它们似乎有很多;在您喜爱的搜索引擎中搜索“pdf解析器库”(以及您的语言)

一些热门歌曲:

(对于.NET,有几个)

请注意,如果要编辑现有PDF,可能需要阅读以下内容:

我非常推荐 pdflib()。
它的商业版,但它也有一个精简版,你可以免费使用私人。它包含非常多的功能,可用于所有平台形式。

Pdfium.Net SDK也可以帮助您。通过此API,您可以访问文本、图像和其他对象以及其他属性的集合。
请注意,我在开发此API的公司工作。

谢谢TrueWill,我以前搜索过,发现其中一些人可能具有强大的创建PDF的能力,但在解析时没有那么强大,我希望能从有经验的人那里得到一些指导,这样我就可以在不花太多时间评估所有这些库的情况下跳到正确的方向上。在阅读了你推荐的文章之后,我对是否有这样一个库感到悲观