iTextSharp PDF使用C读取高亮文本(高亮注释)#

iTextSharp PDF使用C读取高亮文本(高亮注释)#,pdf,itextsharp,pdf-scraping,Pdf,Itextsharp,Pdf Scraping,我正在开发一个C#winform应用程序,将pdf内容转换为文本。除pdf突出显示的文本中的内容外,所有必需的内容都将被提取。 请帮助获取工作示例以提取pdf中突出显示的文本。 我在项目中使用iTextSharp.dll,假设您正在谈论注释。请试试这个: for (int i = pageFrom; i <= pageTo; i++) { PdfDictionary page = reader.GetPageN(i); PdfArray annots = page.GetA

我正在开发一个C#winform应用程序,将pdf内容转换为文本。除pdf突出显示的文本中的内容外,所有必需的内容都将被提取。 请帮助获取工作示例以提取pdf中突出显示的文本。
我在项目中使用iTextSharp.dll,假设您正在谈论注释。请试试这个:

for (int i = pageFrom; i <= pageTo; i++) {
    PdfDictionary page = reader.GetPageN(i);
    PdfArray annots = page.GetAsArray(iTextSharp.text.pdf.PdfName.ANNOTS);
    if (annots!=null)
        foreach (PdfObject annot in annots.ArrayList) {
            PdfDictionary annotation = (PdfDictionary)PdfReader.GetPdfObject(annot);
            PdfString contents = annotation.GetAsString(PdfName.CONTENTS);
            // now use the String value of contents
        }
    }
}

for(int i=pageFrom;我是说注释?你需要更清楚。注释是不属于页面内容流的元素。它们总是添加在页面顶部,并有自己的外观流。你可以在Adobe Reader中的单独面板中列出它们。我们是在讨论此类内容吗?