正在查找基于词典的.NET文本压缩库

正在查找基于词典的.NET文本压缩库,.net,compression,.net,Compression,我正在寻找一个基于.NET字典的压缩库,它可以让我用一个大的常用词列表/字符串“种子”它,它可以用来构建它的字典 我之所以希望在LZMA等上使用它,是因为我想独立压缩短字符串,它们彼此非常相似。设想压缩一本简单的儿童读物,但单独压缩每一页。如果我们压缩整本书,那么LZMA会很好,但对于较短的字符串来说就不是那么好了 有这样的东西吗 提供基于字典的压缩。函数deflateSetDictionary()和inflateSetDictionary()的功能与您描述的完全相同。内置GZip:。您应该根据

我正在寻找一个基于.NET字典的压缩库,它可以让我用一个大的常用词列表/字符串“种子”它,它可以用来构建它的字典

我之所以希望在LZMA等上使用它,是因为我想独立压缩短字符串,它们彼此非常相似。设想压缩一本简单的儿童读物,但单独压缩每一页。如果我们压缩整本书,那么LZMA会很好,但对于较短的字符串来说就不是那么好了


有这样的东西吗

提供基于字典的压缩。函数deflateSetDictionary()和inflateSetDictionary()的功能与您描述的完全相同。

内置GZip:。您应该根据自己的需要将其部署为SQLCLR UDF函数,请参见

。您似乎在要求一些可以注入任意、不必要数据的功能,以便获得更高的压缩百分比。有点像买100件东西来节省10%,而实际上你只需要1件。或者,我误解了什么。这也是很有可能的。我不是专家,但我认为大多数压缩算法已经解决了这个问题。它们在位级别运行,非常有效。如果你认为你可以做得更好,试着写你自己的。@LachlanB我想他得到的是这样一个想法:你可以通过更大的重复数据集获得更好的压缩比。例如,如果在一段大小适中的文本中,单词“purple”重复一千次,则压缩效果会比只使用一次更好。同样的原因,一个纯色的、单色的PNG文件无论其物理大小都大致相同。但他似乎只想添加额外的数据来实现额外的压缩比。所需的输出是自包含的,即包含字典或其适用子集,还是需要单独的参考字典来解压缩各种“页面”?我的道歉-我忘了包括用户92546猜测的重要方面。是的--我会有一个单独的引用字典,这是解压缩页面所必需的。我在那个类中没有看到任何支持设置字典的东西。除非有提供该功能的界面,否则该用户将需要直接使用zlib库。好的,谢谢。我只需要。现在就把它上网。@Flibble先生:已经完成了;请参阅ZLib包中的目录contrib/dotzlib。遗憾的是,dotzlib没有提供到*SetDictionary函数的接口。不过,这或许可以作为弗利布尔先生的出发点。(弗利布尔先生。弗利布尔先生。我喜欢这么说。弗利布尔先生。)那么也许弗利布尔先生可以提交一个更新版本的dotzlib。