C# 高效地查找Docx文件中最近发生更改的段

C# 高效地查找Docx文件中最近发生更改的段,c#,ms-word,C#,Ms Word,我正在开发一个备份Docx文件的应用程序。对于初始备份,我会将整个文件复制到目标中,但下一次我要执行增量备份,即只备份发生更改的Docx文件段。我需要找到最有效的方法来做同样的事情。 如果我能在这方面得到任何帮助,我将非常感激。DOCX文件与以前的Microsoft Word程序不同,后者使用文件扩展名DOC,因为DOC文件使用文本或二进制格式存储文档,DOCX文件基于XML并使用ZIP压缩以获得较小的文件大小。换句话说,DOCX文件是使用ZIP压缩的一组XML文件 如果您可以使用来解析和判断哪

我正在开发一个备份Docx文件的应用程序。对于初始备份,我会将整个文件复制到目标中,但下一次我要执行增量备份,即只备份发生更改的Docx文件段。我需要找到最有效的方法来做同样的事情。
如果我能在这方面得到任何帮助,我将非常感激。

DOCX文件与以前的Microsoft Word程序不同,后者使用文件扩展名DOC,因为DOC文件使用文本或二进制格式存储文档,DOCX文件基于XML并使用ZIP压缩以获得较小的文件大小。换句话说,DOCX文件是使用ZIP压缩的一组XML文件


如果您可以使用来解析和判断哪个文件确实发生了更改,然后仅增量保存VCS中的更改,这可能会有所帮助。

我已经使用zip(PK结构)阅读了一个docx文件,并将字节块(PK到PK)存储在网络位置上。还计算块上的md5哈希并保存在哈希表中。现在,我修改了相同的docx文件,在末尾添加了一些文本,并将其保存为新文件。我使用了我的应用程序的相同实例,并使用相同的PK块读取新创建的文件,并将新创建的md5与旧的md5进行比较。但我只能在许多重复块中找到两个。还有什么别的事情需要我去考虑吗?