Ms word 装满<;w:p>;标签

Ms word 装满<;w:p>;标签,ms-word,openxml,Ms Word,Openxml,我女朋友正在为家庭作业写Word文档。她正在按照老师的要求使用旧的.doc格式(:')()。 在某个时刻,.doc文件从150KB变为2.6MB,但没有明显的变化(见Dropbox历史记录。遗憾的是,Word的比较功能因Word崩溃而失败)。从那时起,她无法在不使Word崩溃的情况下保存文档 我将.doc转换为docx,解压缩后发现了一个18MB的document.xml文件! 我甚至无法正确格式化xml,因为它会使Notepad++崩溃,但我可以看到该文件中填充了相同的xml标记,并反复重复:

我女朋友正在为家庭作业写Word文档。她正在按照老师的要求使用旧的.doc格式(:')()。 在某个时刻,.doc文件从150KB变为2.6MB,但没有明显的变化(见Dropbox历史记录。遗憾的是,Word的比较功能因Word崩溃而失败)。从那时起,她无法在不使Word崩溃的情况下保存文档

我将.doc转换为docx,解压缩后发现了一个18MB的document.xml文件! 我甚至无法正确格式化xml,因为它会使Notepad++崩溃,但我可以看到该文件中填充了相同的xml标记,并反复重复:

<w:p w:rsidR="002A70E5" w:rsidRDefault="002A70E5" w:rsidP="00565ED9"/>

你知道这是什么原因吗

编辑:


EDIT2:这个问题的动机更多的是好奇,而不是寻找解决方案。谢谢你的回答。

你所说的标签是用于构建word文档的OpenXml格式。OpenXml将文档存储为压缩文件,我担心你会看到解压缩的document.xml文件。如果你想继续工作,请使用对于文档,只需将文档文件转换为docx。不要解压缩它。

如果您愿意直接编辑XML,您可以删除所有空的
标记并重新压缩

如果您擅长Python,可以尝试使用
pythondocx
删除所有空段落

希望这至少能恢复她迄今为止所做的工作


我不知道这是怎么发生的,也不知道这是否很重要。我唯一能想到的是键盘上的回车键会插入大量回车符。这些回车符都会插入一个新的段落。事实上,在Mac上运行的Windows虚拟机上,我偶尔会遇到这种情况。不知道它为什么会这样做。

是的,我知道知道所有这些…但文件已损坏!它无缘无故地充满了此标记。document.xml文件包含约18.600.000个字符,前18.500.000个字符是此标记未经更改而重复出现的,您真的认为这是正常情况吗?您认为它已损坏是什么意思?您不能打开docx文件吗?向向下的投票者靠近,d你介意告诉我为什么你认为这个问题不合适,并给我指出正确的社区吗?Thx…我刚下载了文档,它似乎工作正常。你设法把它修好了吗?是的,它工作正常,但它非常沉重,试着将它保存为.doc。我终于成功地正确显示了xml。有问题的标记在哪里在一个单一的文本区域。我删除并重新创建了它,标签就不见了。哦,考虑到我们有一只猫经常睡在键盘上,你说得很对:D