C# 内容而非页面pdf比较库

C# 内容而非页面pdf比较库,c#,pdf,C#,Pdf,我正在寻找一个可以在C#windows应用程序中用于比较PDF文件的库。我见过很多用于进行页面pdf比较的工具(例如,)。然而,我想要内容方面的比较。这意味着,如果添加或删除的内容会导致更改后的所有内容都被移动,那么我不希望被移动的内容被视为已更改 一种选择是从pdf文件中提取文本,然后使用Eugene W.Myers在其论文“O(ND)差分算法及其变体”中提出的算法进行文本比较。然而,我想知道是否有一个工具或库可以在C#中使用来实现这一点?理想情况下,该工具将显示整个原始文档并突出显示更改。该

我正在寻找一个可以在C#windows应用程序中用于比较PDF文件的库。我见过很多用于进行页面pdf比较的工具(例如,)。然而,我想要内容方面的比较。这意味着,如果添加或删除的内容会导致更改后的所有内容都被移动,那么我不希望被移动的内容被视为已更改

一种选择是从pdf文件中提取文本,然后使用Eugene W.Myers在其论文“O(ND)差分算法及其变体”中提出的算法进行文本比较。然而,我想知道是否有一个工具或库可以在C#中使用来实现这一点?理想情况下,该工具将显示整个原始文档并突出显示更改。该工具还将检测其他内容更改,如图像更改


谢谢

一个商业选项是DocsCorp compareDocs SDK(也称为DocuComp)

它是一种基于内容的比较解决方案。例如,由于插入新段落而改变内容不会导致所有后续文本被视为“更改”。插入的段落将标记为“插入”,而后续文本仍将被视为“相同”

PDF到PDF的比较,输出为单个PDF。更改显示为注释(插入显示为带下划线的文本,删除由锚定到删除发生点的PDF注释(黄色便笺)表示)。输出可以是说明更改的单个PDF。这是基于修改后的PDF,或者它可以在一个PDF中显示表示两个PDF的并排视图

比较仅基于文本。它目前不尝试在PDF中显示图像或其他图形元素的更改

为了充分披露,我受雇于并部分拥有这家公司。我的职位是研发副总裁

问候
Shane

对于图书馆来说,你想要的是相当精确的。如果您想要一个应用程序或GUI组件,我可以理解,但是库有点太多了。你确定你的要求是正确的吗?