Algorithm 以下无损数据压缩算法在理论上有效吗?

Algorithm 以下无损数据压缩算法在理论上有效吗?,algorithm,compression,Algorithm,Compression,我想知道下面的算法是否是一种有效的无损数据压缩算法(尽管在传统计算机上不实用,可能是量子计算机?) 在较高且简化的级别上,压缩步骤为: 计算未压缩文本的字符频率 计算未压缩文本的SHA3-512(或其他哈希函数) 连接SHA3-512和字符频率(这是将写入文件的压缩文本) 在较高且简化的级别上,解压缩步骤为: 使用压缩文件中的字符频率,生成未压缩文本的排列(跟踪哪个排列) 在步骤1中计算生成置换的SHA3-512 如果步骤2中计算的SHA3-512与压缩文件中的SHA3-512匹配,则解压缩完成

我想知道下面的算法是否是一种有效的无损数据压缩算法(尽管在传统计算机上不实用,可能是量子计算机?)

在较高且简化的级别上,压缩步骤为:

  • 计算未压缩文本的字符频率
  • 计算未压缩文本的SHA3-512(或其他哈希函数)
  • 连接SHA3-512和字符频率(这是将写入文件的压缩文本)
  • 在较高且简化的级别上,解压缩步骤为:

  • 使用压缩文件中的字符频率,生成未压缩文本的排列(跟踪哪个排列)
  • 在步骤1中计算生成置换的SHA3-512
  • 如果步骤2中计算的SHA3-512与压缩文件中的SHA3-512匹配,则解压缩完成。否则,请转至步骤1
  • 是否可能与未压缩文本的排列发生SHA3-512冲突(即,给定字符频率的两个排列是否具有相同的SHA3-512?)?如果是,什么时候开始出现这种情况(即,在多少个未压缩的文本字符之后?)

    一个简化示例如下所示:

    • 未压缩文本为:“Lorem ipsum dolor sit amet,献祭精英。在ac libero的Maecenas和enim vitae ligula ultricies molestie。两人一组,莫利斯一组,波特一组。埃涅亚的封建制度使我们的饮食更加便利。这是一个很好的例子。最重要的是,效率要素,自由之路。Etiam metus leo,hendrerit ac dui in,hendrerit blandit sem。佩伦茨克大学。这是我生命中最重要的部分。努拉是莫里斯·泰勒斯。佩伦特式居住者morbi tristique Sentecus et netus et malesuada以turpis egestas闻名。整数sollicitudin dui sapien,单位:tempus arcu facilisis in。多洛对多洛的生命,阿库姆萨对阿库姆萨对阿库姆萨对阿库姆萨对阿库姆萨对阿库姆萨对阿库姆萨对阿库姆萨对阿库姆萨对阿库姆萨对阿库姆萨对阿库姆萨对阿库姆萨对阿库姆。在拍卖商康格·佩伦茨克。这是一种很好的交通工具。权杖,权杖,权杖。南维塔尤伊斯莫德酒店。发酵前的发酵液可以用来发酵。佩伦特斯大猫咪、欧盟车辆、viverra前前庭的tincidunt ac justo nec orci semper、nec Consequeat justo faucibus。福吉亚·努拉(cursus nunc facilisis id.Suspendisse potenti)的显贵牧师。艾蒂安·康莫多·图尔皮斯非弗林吉利亚·森佩尔。不含色素的不等长胎体,以及胎盘的矢状体。这是一个很好的例子。尤伊斯莫·奥里姆葡萄园(Curabitur euismod orci lorem)是一种发酵剂,它的发酵速度非常快。大草根。库拉比图尔皮斯酒店。前庭。莫比·拉奥里特·马萨·维尔·努拉是个封建孕妇。纳拉是一种芸香。最大时相,欧盟矢状体前蜗壳,双柱状体后柱状体后柱状体后柱状体后柱状体后柱状体后柱状体后柱状体后柱状体后柱状体后柱状体后柱状体后柱状体后柱状体后柱状体。狮子座射手座。这是一个非常好的例子。这是我的荣幸。但事实上,这是一个正确的选择。Donec maximus ante odio,一个位于。这是一个很好的例子。我是艾库利斯·布兰迪特。达比布斯吊牌、非威尼斯福西布斯吊牌、尤斯莫·内克吊牌、马萨非菲尼布斯吊牌。这句话的意思是:“我不知道该怎么说。”。佩伦特式居住者morbi tristique Sentecus et netus et malesuada以turpis egestas闻名。在faucibus中,Interdum和malesuada在第一次同侧前就出名了。红葡萄酒品种,威尼斯红葡萄酒。如果你是我的朋友,我会为你祈祷。阿利奎特·奥纳·乌兰科珀的效率。毛里斯圣殿,乌兰科珀的尤里西斯之家,温度之家,孕妇之家。Suspendisse et viverra enim,但设施是enim。奎斯奎斯精英钻石。Morbi quis nulla bibendum,molestie risus egestas,pharetra nisl。阿利奎姆·塞德·马萨·迪克图姆,奥迪奥·维尔,菲尼布斯·泰勒斯。Nam tristique commodo sem,一个关于真理的名言。拍卖人是奥古斯都的一名拍卖人。Donec ac Pellentsque侵权人。在hendrerit ultricies consequat。在狮子座,佩伦特式的非梅特斯式的生活精英是最有效的。那是一个巨大的脉冲。请不要担心,奥古斯·拉奥里特·比本杜姆的生命是最有效的。Lorem ipsum dolor sit amet,是一位杰出的献身者。Lorem ipsum dolor sit amet,是一位杰出的献身者。不可能,不可能,不可能,不可能。前庭调味品,eu euismod turpis。”
    • 字符频率为:⎵:501 e:345I:277U:266 s:240 t:226 a:161 n:154 r:147 m:132 c:128 o:117 d:79:64 p:54,:47 v:40 q:39 f:35 g:31 b:31 h:11 p:9 n:9 s:8 x:7 d:6 v:6 m:5 i:4 c:4 j:4 l:3 a:3 e:3 f:2 u:1 q:1”
    • SHA3-512为:“45EBDE65CF667D1BFDCF779BAAB84301C1D4ABE60448BE821ADDA9CF7B99B36A61C53233DB4A0EDA93A04C75201BE13BBB638B5E78F504760FFFC97F1C95ADB”
    • 压缩文件内容为:“45ebde65cf667d1bfdcf779baab84301c1d4abe60448be821adda9cf7b99b36a61c53233db4a0eda93a04c75201be13bbb638b5e78f5047560fffc97f1c95adb⎵:501 e:345I:277U:266 s:240 t:226 a:161 n:154 r:147 m:132 c:128 o:117 d:79:64 p:54,:47 v:40 q:39 f:35 g:31 b:31 h:11 p:9 n:9 s:8 x:7 d:6 v:6 m:5 i:4 c:4 j:4 l:3 a:3 e:3 f:2 u:1 q:1”

    压缩方法假设给定字符频率表中只有一个排列将生成给定的哈希代码。这是可以证明的错误

    512位散列可以表示1.34E+154个唯一值的顺序。100个字符文件中的排列数为100!或9.33E+157

    给定一个100个字符的文件,每个可能的512位有6900多个不同的排列