Performance 数据压缩和重复数据消除之间的实际差异
重复数据消除和数据压缩之间的确切区别是什么 据我所知,重复数据消除是指当我们拥有完全相同的数据拷贝(相同块(块级重复数据消除)或相同文件(文件级重复数据消除)时,存储中只保留一个拷贝,并且对于该拷贝,每次不同用户使用该块或文件时,引用计数都会增加 但是压缩是如何在内部工作的 请帮我解决这个问题。Performance 数据压缩和重复数据消除之间的实际差异,performance,duplicates,compression,storage,netapp,Performance,Duplicates,Compression,Storage,Netapp,重复数据消除和数据压缩之间的确切区别是什么 据我所知,重复数据消除是指当我们拥有完全相同的数据拷贝(相同块(块级重复数据消除)或相同文件(文件级重复数据消除)时,存储中只保留一个拷贝,并且对于该拷贝,每次不同用户使用该块或文件时,引用计数都会增加 但是压缩是如何在内部工作的 请帮我解决这个问题。 提前感谢。简单的回答是,重复数据消除可以被视为一种高度专业化的压缩形式,针对特定的环境。接下来是详细的答案 在对比这些技术之前,让我们先谈谈典型的压缩是如何工作的 压缩 压缩本身是极其多样的。你有一些有
提前感谢。简单的回答是,重复数据消除可以被视为一种高度专业化的压缩形式,针对特定的环境。接下来是详细的答案 在对比这些技术之前,让我们先谈谈典型的压缩是如何工作的 压缩 压缩本身是极其多样的。你有一些有损压缩算法,比如JPEG和MP3,它们使用一个我们如何看或听的模型来丢弃一些对图像或声音可能不那么重要的信息,但仍然会降低质量。根据您的问题,这些技术大多超出了问题的范围 您可能最关心的是我们所谓的通用无损算法,如zip、LZMA、LZ4等,它们以可逆的方式压缩任意文件。通常,这些压缩文件至少使用以下非详尽列表中的几种技术:
开发者
developers (0,11)(0,22)
其中(0,11)表示“重复使用从位置0开始的11个字符”。这被称为“匹配查找”或LZ77风格的压缩,非常简单
aabcabcabaacbaacbcaabaacbaa
0
进行编码,而B和C分别分配10
和11
。如果您最初使用的是每个字符8位,这是一个很大的节省
- 您通常不能简单地获取压缩数据并解压缩其中的任意部分,例如“解压缩此文件的最后500字节”。您可能需要从头开始读取整个压缩文件,或者至少从流中的某个已知点开始读取
- 修改未压缩的输入可能会对压缩的输出产生任意大的影响。例如,更改输入中的单个字节可能会更改输出中的每个后续字节。这通常意味着难以增量地更新大型压缩流(即,基于对输入的修改)