C# 拆分文档文件页面并使用gembox文档转换为PDF

C# 拆分文档文件页面并使用gembox文档转换为PDF,c#,gembox-document,C#,Gembox Document,我想通过搜索每页上的特定单词(可能在一页或多页上),将该页的整个内容转换为PDF。 例如,我们有一个有三页的文件,第一页有一个特殊单词,第三页有下一个特殊单词。我想将PDF从第一页保存到第二页,然后分别保存第三页。PDF文件将根据该页面上的特定单词命名 我的问题是,我不知道如何循环每个页面并阅读该页面的内容,从而找到特殊单词并将页面保存为PDF格式。 谢谢你以下是你的方法 使用DocumentModel.GetPaginator方法为Word文档分页 使用扩展方法阅读每页的文本内容 使用Docu

我想通过搜索每页上的特定单词(可能在一页或多页上),将该页的整个内容转换为PDF。 例如,我们有一个有三页的文件,第一页有一个特殊单词,第三页有下一个特殊单词。我想将PDF从第一页保存到第二页,然后分别保存第三页。PDF文件将根据该页面上的特定单词命名

我的问题是,我不知道如何循环每个页面并阅读该页面的内容,从而找到特殊单词并将页面保存为PDF格式。
谢谢你

以下是你的方法

  • 使用
    DocumentModel.GetPaginator
    方法为Word文档分页
  • 使用扩展方法阅读每页的文本内容
  • 使用
    DocumentModelPage.Save
    方法将所选页面保存到PDF
  • 换句话说,请尝试以下操作:

    string search = "Your Specific Word";
    string inputPath = "input.docx";
    
    // Load Word document.
    var document = DocumentModel.Load(inputPath);
    
    // 1. Get document's pages.
    var pages = document.GetPaginator().Pages;
    
    for (int i = 0, count = pages.Count; i < count; ++i)
    {
        // 2. Read page's text content.
        DocumentModelPage page = pages[i];
        string pageTextContent = page.PageContent.ToText();
    
        // 3. Save page as PDF.
        if (pageTextContent.Contains(search))
        {
            string outputPath = $"{search}_{i}.pdf";
            page.Save(outputPath);
        }
    }
    
    string search=“您的特定单词”;
    字符串inputPath=“input.docx”;
    //加载Word文档。
    var document=DocumentModel.Load(inputPath);
    // 1. 获取文档的页面。
    var pages=document.GetPaginator().pages;
    对于(int i=0,count=pages.count;i
    所有已发布的内容都是程序说明。但是,我们需要您根据页面提出一个问题。我们不能确定你想从我们这里得到什么。请在您的帖子中加入我们可以回答的有效问题。提醒:通过访问网站,确保您知道这里的主题;要求我们为您编写程序、建议和外部链接都是离题的。谢谢重播。这项工作,但这个导出总是一页,如果特定的单词存在于第一页和第三页,我想导出2个文件(一个文件:第一到第二页)(第二个文件:只有第三页)@samsamsamangi你能把你的Word文档上传到某个地方并给我一个链接,让我看看吗?