iTextSharp PDF使用C读取高亮文本（高亮注释）#_Pdf_Itextsharp_Pdf Scraping

iTextSharp PDF使用C读取高亮文本（高亮注释）#

pdf

iTextSharp PDF使用C读取高亮文本（高亮注释）#,pdf,itextsharp,pdf-scraping,Pdf,Itextsharp,Pdf Scraping,我正在开发一个C#winform应用程序，将pdf内容转换为文本。除pdf突出显示的文本中的内容外，所有必需的内容都将被提取。请帮助获取工作示例以提取pdf中突出显示的文本。我在项目中使用iTextSharp.dll，假设您正在谈论注释。请试试这个： for (int i = pageFrom; i <= pageTo; i++) { PdfDictionary page = reader.GetPageN(i); PdfArray annots = page.GetA

我正在开发一个C#winform应用程序，将pdf内容转换为文本。除pdf突出显示的文本中的内容外，所有必需的内容都将被提取。请帮助获取工作示例以提取pdf中突出显示的文本。

我在项目中使用iTextSharp.dll，假设您正在谈论注释。请试试这个：

for (int i = pageFrom; i <= pageTo; i++) {
    PdfDictionary page = reader.GetPageN(i);
    PdfArray annots = page.GetAsArray(iTextSharp.text.pdf.PdfName.ANNOTS);
    if (annots!=null)
        foreach (PdfObject annot in annots.ArrayList) {
            PdfDictionary annotation = (PdfDictionary)PdfReader.GetPdfObject(annot);
            PdfString contents = annotation.GetAsString(PdfName.CONTENTS);
            // now use the String value of contents
        }
    }
}

for（int i=pageFrom；我是说注释？你需要更清楚。注释是不属于页面内容流的元素。它们总是添加在页面顶部，并有自己的外观流。你可以在Adobe Reader中的单独面板中列出它们。我们是在讨论此类内容吗？