File 为什么.doc文件比.txt文件占用更多的内存空间?

File 为什么.doc文件比.txt文件占用更多的内存空间?,file,memory,text,doc,File,Memory,Text,Doc,我有.doc文件和.txt文件,其中只有1个作为内容。但是.doc文件需要10.9kb,而.txt文件只需要1个字节。一个.txt文件包含1个字节的纯文本字符,.doc文件包含所有Word文档元数据,如字体样式、大小、页边距等。一个.txt文件包含1个字节的纯文本字符,.doc文件包含所有Word文档元数据,如字体样式、大小、,页边距等自我探索: 将文档另存为.docx文件 将foo.docx重命名为foo.docx.zip所有Microsoft X-document文件都是zip文件 解压缩f

我有.doc文件和.txt文件,其中只有1个作为内容。但是.doc文件需要10.9kb,而.txt文件只需要1个字节。

一个.txt文件包含1个字节的纯文本字符,.doc文件包含所有Word文档元数据,如字体样式、大小、页边距等。

一个.txt文件包含1个字节的纯文本字符,.doc文件包含所有Word文档元数据,如字体样式、大小、,页边距等

自我探索:

将文档另存为.docx文件

将foo.docx重命名为foo.docx.zip所有Microsoft X-document文件都是zip文件

解压缩foo.docx.zip

查看提取的XML文件-与保存的Word文档中包含的其他资源相关的大多数文件

doc文件本质上只是.docx文件的旧二进制版本,包含类似的元数据信息。这可以通过二进制/十六进制编辑器查看

保存内容本身时也存在结构差异

文本文件只包含文本内容,而不包含其他内容,这就是为什么它与单字节编码的内容大小相同。

Self exploration:

将文档另存为.docx文件

将foo.docx重命名为foo.docx.zip所有Microsoft X-document文件都是zip文件

解压缩foo.docx.zip

查看提取的XML文件-与保存的Word文档中包含的其他资源相关的大多数文件

doc文件本质上只是.docx文件的旧二进制版本,包含类似的元数据信息。这可以通过二进制/十六进制编辑器查看

保存内容本身时也存在结构差异


文本文件只包含文字内容,而不包含其他内容,这就是为什么它与单字节编码的内容大小相同。

因为它们是不同的格式,存储不同的东西,例如样式,因为它们是不同的格式,存储不同的东西,例如样式