Compression deflate是否能够很好地压缩紧密交错的可压缩和不可压缩数据?

Compression deflate是否能够很好地压缩紧密交错的可压缩和不可压缩数据?,compression,deflate,Compression,Deflate,假设我有一个可重复的模式,比如4个随机字节的随机数据,4个可预测字节,4个新的随机字节,相同的4个可预测字节,等等。这是放气可以很好压缩的东西吗 4字节是否太短,无法很好地压缩? deflate是否内置支持这样的可压缩/不可压缩交叉数据? 其他常见的压缩格式是否能更好地处理这种模式?您必须定义“well”,但是的,deflate可以并且将利用重复字符串短至三个字节的优势 没有什么比试一下更好的了。我生成了100000组四个随机字节,后跟四个零,总共800000个字节。gzip将其压缩到大约500

假设我有一个可重复的模式,比如4个随机字节的随机数据,4个可预测字节,4个新的随机字节,相同的4个可预测字节,等等。这是放气可以很好压缩的东西吗

4字节是否太短,无法很好地压缩?
deflate是否内置支持这样的可压缩/不可压缩交叉数据?
其他常见的压缩格式是否能更好地处理这种模式?

您必须定义“well”,但是的,deflate可以并且将利用重复字符串短至三个字节的优势


没有什么比试一下更好的了。我生成了100000组四个随机字节,后跟四个零,总共800000个字节。gzip将其压缩到大约500000字节。这还不错,因为它肯定不会比400000更好,400000是随机数据的大小。

如果只有1个随机字节/1个可预测字节/1个随机字节会怎么样。。。。等等在这种情况下,算法似乎会失败。但是,如果将字符串重塑为所有奇数字节后跟所有偶数字节,它几乎可以完美地压缩字符串。这是否超出了deflate的能力?deflate无法检测或利用这一点。这将需要您建议的预处理。事实上,对表进行转置是改进压缩的一种常见方法,它将具有相关值的列转换为行。