Warning: file_get_contents(/data/phpspider/zhask/data//catemap/1/hibernate/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Math 计算两个文件之间的相关系数-十六进制值直方图相关性_Math_Hex_Correlation_Hex Editors - Fatal编程技术网

Math 计算两个文件之间的相关系数-十六进制值直方图相关性

Math 计算两个文件之间的相关系数-十六进制值直方图相关性,math,hex,correlation,hex-editors,Math,Hex,Correlation,Hex Editors,我是一名新的CS学生,我的老师要求我们取2个txt文件,比较它们的十六进制值。每个文件的内容分别为“abcde…XYZ”和“accde…XYZ”。我已经将每个字符出现的百分比值输入到excel表格中,现在我需要通过计算这两个文件之间的相关系数来了解他的意思 如果您需要更多了解我的问题,请随时提问。An是分布的图形表示。 [离散]分布是特定值样本数量的有序序列,或者在概率分布的情况下,概率值的有序序列:随机抽取的样本具有该特定值的概率 首先,您需要通过对两个二进制文件应用相同的加密链来生成它们,精

我是一名新的CS学生,我的老师要求我们取2个txt文件,比较它们的十六进制值。每个文件的内容分别为“abcde…XYZ”和“accde…XYZ”。我已经将每个字符出现的百分比值输入到excel表格中,现在我需要通过计算这两个文件之间的相关系数来了解他的意思

如果您需要更多了解我的问题,请随时提问。

An是分布的图形表示。
[离散]分布是特定值样本数量的有序序列,或者在概率分布的情况下,概率值的有序序列:随机抽取的样本具有该特定值的概率

首先,您需要通过对两个二进制文件应用相同的加密链来生成它们,精确地,如分配中所述。这本身似乎是对这些加密算法和各种块加密模式(ECB、CBC等)的亲身体验/复习

然后,对于每个文件,需要计算每个invidudual十六进制值的数目,给出一个从0到255的数组(或者说是从$00到$FF的“十六进制”),其中包含在文件中找到的每个对应二进制八位字节的计数。请注意,数组中的单元格数(在直方图行话中也称为“bin”)正好是256,因此,如果在文件中找不到具有相应十六进制值的字节,则单元格的值为0。
这些数组是每个文件中十六进制值的离散分布;通常对这些数组进行规范化,典型的方法是生成另一个大小相同的数组(此处为256个单元格),但包含实值,其中每个值是该单元格的样本数与样本总数的比率。因此,这样的数组包含文件*中十六进制值的*概率分布(虽然是可选分布,但我们通常将其称为“分布”,而不是“概率”分布)(还有……一些书呆子可能会嘲笑这些被称为概率的东西,但在这一点上我们不要混淆了……)

然后,我建议您以典型的条形图/直方图格式绘制这些分布,仅此一点就可以直观地显示这两个分布有多相似。我不想破坏这一发现的乐趣,但我可能会暗示,如果这两个图确实有很大的不同,您不应该失望。)

最后一步是计算这两个分布的形式相关值,即“总结”这两个分布的相似程度的单个值。这就是为什么我没有给你作业的全部细节,部分原因是我不敢提出一个特定的相关函数;有,;请咨询您的讲师或助教以获取建议


Bonus/为了好玩,您可以计算并绘制未加密文件的相同分布、直方图和相关系数(显然,在这里您希望它们非常相似)。

老师希望您如何比较十六进制值?如果你在问题中包含你所获得的作业的确切陈述,那可能是最好的。创建两个不同1位、64字节长的文本文件,即text.1.txt:abcdef…zABCDE…Z text.2.txt:accdef…zABCDE…Z加密每八次-使用DES和AES,每个算法分为四种模式:ECB、CBC、,CFB和OFB。对每个DES加密使用相同的密钥和算法参数(即初始化向量)。对于每种AES加密也是如此。计算C(Text.1.txt)和C(Text.2.txt)之间的相关系数并进行注释。这有帮助吗?如果你把它编辑到问题中会有帮助,段落在哪里断开等会显示出来。使用blockquote语法(你在每行前面加上
),所以我的问题是我没有足够的信息来计算相关系数。我把我的大部分字节都用grep替换掉了,所以我只有字母数字字符,需要全部256个字符才能工作。我重读了你的建议,得出了这个结论,所以谢谢你。