C# 如何在C语言中从PDF文档中提取标题#

C# 如何在C语言中从PDF文档中提取标题#,c#,pdf,itext,classification,data-extraction,C#,Pdf,Itext,Classification,Data Extraction,我可以使用iTextsharp从PDF文档中提取文本,但无法将提取的文本分类为标题及其段落内容。我只需要文件段落的标题。由于它是一个非结构化文档,我们无法使用字体属性,如粗体、字体大小。请在这方面帮助我。听起来很神奇,“因为这是一个非结构化文档,我们无法使用粗体、字体大小等字体属性”-嗯。。。你能用什么?因为只有你有这些文件,我们怎么知道?

我可以使用iTextsharp从PDF文档中提取文本,但无法将提取的文本分类为标题及其段落内容。我只需要文件段落的标题。由于它是一个非结构化文档,我们无法使用字体属性,如粗体、字体大小。请在这方面帮助我。

听起来很神奇,“因为这是一个非结构化文档,我们无法使用粗体、字体大小等字体属性”-嗯。。。你能用什么?因为只有你有这些文件,我们怎么知道?