Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/file/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
File 当数据相同时,哪种文件格式最小?_File_Format - Fatal编程技术网

File 当数据相同时,哪种文件格式最小?

File 当数据相同时,哪种文件格式最小?,file,format,File,Format,当我们有相同的数据时,如制表符分隔文件(TSF)或逗号分隔文件(CSV)或纯文本文件(由任何特定文件或任何其他文件分隔),如果任何人能够建议最小的文件大小数据格式,这将非常有帮助 希望一旦我们了解了最小的文件格式,就可以使用GZip或7zip压缩文件。我尝试过JSON、BSON、YAML、协议缓冲区、Avro、XML格式 Yaml像JSON格式一样可读,但它消耗了大量内存。 很明显,XML也在消耗巨大的内存 Proto Buffer和Avro在大小方面优于CSV和TSV文件,但数据是非人类可读的

当我们有相同的数据时,如制表符分隔文件(TSF)或逗号分隔文件(CSV)或纯文本文件(由任何特定文件或任何其他文件分隔),如果任何人能够建议最小的文件大小数据格式,这将非常有帮助


希望一旦我们了解了最小的文件格式,就可以使用GZip或7zip压缩文件。

我尝试过JSON、BSON、YAML、协议缓冲区、Avro、XML格式

Yaml像JSON格式一样可读,但它消耗了大量内存。 很明显,XML也在消耗巨大的内存 Proto Buffer和Avro在大小方面优于CSV和TSV文件,但数据是非人类可读的格式。
我的建议是使用符合可读性和大小的JSON。此外,API还可以轻松解析JSON。

它们不是一样吗?制表符和逗号都是一个字符。我认为SaggingRufus是对的,但为什么不试试呢?@hering这通常是一个很好的起点!我尝试过bot的格式,文件的大小是相同的-就像生成了一个有10万条记录的文件,两种格式的大小都是相同的。如果您能告诉我是否有其他需要检查的格式,那将非常有帮助。