Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/drupal/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Compression 纯文本压缩算法的当前状态是什么?_Compression_Lossless Compression_Text Compression - Fatal编程技术网

Compression 纯文本压缩算法的当前状态是什么?

Compression 纯文本压缩算法的当前状态是什么?,compression,lossless-compression,text-compression,Compression,Lossless Compression,Text Compression,为了纪念, 文本压缩的顶级算法是什么(以及每个算法的简要描述) 注意:这个问题的目的是得到压缩算法的描述,而不是压缩程序的描述。总是有 别开玩笑了: 在考虑兼容性的情况下,PKZIP(DEFLATEalgorithm)仍然获胜 bzip2是享受相对广泛的安装基础和相当好的压缩比之间的最佳折衷方案,但需要单独的归档 (LZMAalgorithm)压缩效果非常好,在LGPL下可用。然而,很少有操作系统附带内置支持 是bzip2的一个变体,在我看来值得更多关注。对于需要长期存档的大型日志文件来说,这

为了纪念, 文本压缩的顶级算法是什么(以及每个算法的简要描述)

注意:这个问题的目的是得到压缩算法的描述,而不是压缩程序的描述。

总是有

别开玩笑了:

  • 在考虑兼容性的情况下,PKZIP(
    DEFLATE
    algorithm)仍然获胜
  • bzip2是享受相对广泛的安装基础和相当好的压缩比之间的最佳折衷方案,但需要单独的归档
  • LZMA
    algorithm)压缩效果非常好,在LGPL下可用。然而,很少有操作系统附带内置支持
  • 是bzip2的一个变体,在我看来值得更多关注。对于需要长期存档的大型日志文件来说,这可能特别有趣。它还需要一个单独的归档员

边界推进压缩器将各种算法结合起来,以获得疯狂的结果。常用算法包括:

  • 使用可预测的算法对字符(或其他位块)进行and-shuffle,以增加重复块,从而使源代码更易于压缩。解压按正常方式进行,结果用反向变换取消混洗。注意:BWT本身实际上并不压缩任何内容。它只是使源代码更容易压缩
  • -预测模型(上下文)是通过处理有关源的统计信息而不是使用静态概率创建的。即使它的根是算术编码,结果也可以用哈夫曼编码或字典以及算术编码来表示
  • 上下文混合-算术编码使用静态上下文进行预测,PPM动态选择单个上下文,上下文混合使用多个上下文并权衡其结果。PAQ使用上下文混合。高层次概述
  • -与PPM相关,但使用位级上下文而不是字节或更长
  • 此外,赫特奖参赛者可以用外部字典中的小字节条目替换普通文本,并用特殊符号区分大写和小写文本,而不是使用两个不同的条目。这就是为什么它们在压缩文本(尤其是ASCII文本)方面如此出色,而在一般压缩方面却没有那么大的价值

是一个非常酷的文本和通用压缩基准网站。马特·马奥尼出版了另一本。Mahoney's可能特别感兴趣,因为它列出了每个条目使用的主要算法。

如果您想将PAQ用作程序,可以在基于debian的系统上安装
zpaq
软件包。用法为(另请参见
man zpaq


压缩约为zip文件大小的1/10。(1.9M vs 15M)

我曾经看到一篇(模拟)文章建议对文本进行有损压缩,性能(大小!)非常出色。。。很有趣。@PhiLho-heh,Summly就是这么做的:)这是PAQ和其他几种纯文本压缩算法()@BrianR.Bondy:没错,
zpaq
压缩了比PKZIP小一个数量级。请参见下文(是的,这是一个工具,但有些人来这里寻找的正是这个工具)是否有压缩文本并返回文本(非二进制)的算法?创建此列表时未发现Pied Piper压缩!我想知道在预测下一个令牌部分时使用gpt3 AI会如何改进到目前为止的最佳结果。它能否击败目前为止最好的成绩。让我们假设我们不在乎速度,想要最大的压缩,就像长期的文本存档一样
zpaq c archivename.zpaq file1 file2 file3