Encoding 为什么不';以明文形式存储的t字处理程序文档?

Encoding 为什么不';以明文形式存储的t字处理程序文档?,encoding,Encoding,每当MS word(或LibreOffice或其他文字处理程序)文档在其各自的程序中打开时,文字通常会显示在页面上,但当文档在文本编辑器中打开时,大部分都是Unicode乱码 我可以理解为什么文档中可能有一些不清晰的部分,如要点或元数据,但为什么至少有一些内容不是以明文形式存储的?每个字母都被编码了吗?我发现这可能是一个品牌的东西。如果需要,可以将其导入文本文件 如果转到“文件>导出>更改文件类型>纯文本(*.txt”),则可以在那里导出文档。Microsoft Word的最后一种格式docx是

每当MS word(或LibreOffice或其他文字处理程序)文档在其各自的程序中打开时,文字通常会显示在页面上,但当文档在文本编辑器中打开时,大部分都是Unicode乱码


我可以理解为什么文档中可能有一些不清晰的部分,如要点或元数据,但为什么至少有一些内容不是以明文形式存储的?每个字母都被编码了吗?

我发现这可能是一个品牌的东西。如果需要,可以将其导入文本文件


如果转到“文件>导出>更改文件类型>纯文本(*.txt”),则可以在那里导出文档。

Microsoft Word的最后一种格式docx是使用zip压缩纯文本的xml。您可以通过将docx重命名为zip来解压缩该文件,然后用记事本打开该文件。因此,它被部分存储为刚刚压缩的纯文本