在SAS中，如果每个记录都有md5哈希，则计算整个文件的md5哈希_Sas_Md5_Checksum

在SAS中，如果每个记录都有md5哈希，则计算整个文件的md5哈希

sas

在SAS中，如果每个记录都有md5哈希，则计算整个文件的md5哈希,sas,md5,checksum,Sas,Md5,Checksum,这是我最近关于在SAS和python中计算md5哈希的问题的后续内容。所以，我使用的是SAS v9.2，有一个md5哈希函数，它接受一个字符串并返回一个哈希。但我真正想要的是一种计算整个文件的哈希值的方法。假设每个记录都有一个散列，有没有办法做到这一点，让文件散列与使用python代码获得的值匹配。以sashelp.shoes数据集为例，我将其导出到CSV文件，并手动删除了货币字段的双引号、美元和逗号。然后，我使用以下python代码计算了整个文件的哈希值： filename = "f:/tes

这是我最近关于在SAS和python中计算md5哈希的问题的后续内容。所以，我使用的是SAS v9.2，有一个md5哈希函数，它接受一个字符串并返回一个哈希。但我真正想要的是一种计算整个文件的哈希值的方法。假设每个记录都有一个散列，有没有办法做到这一点，让文件散列与使用python代码获得的值匹配。以sashelp.shoes数据集为例，我将其导出到CSV文件，并手动删除了货币字段的双引号、美元和逗号。然后，我使用以下python代码计算了整个文件的哈希值：

filename = "f:/test/shoes.csv"
md5_hash = hashlib.md5()
with open(filename,"rb") as f:
    # Read and update hash string value in blocks of 4K
    for byte_block in iter(lambda: f.read(1024*1024),b''):
        md5_hash.update(byte_block.replace(b'\r', b'').replace(b'\n', b''))
    print(md5_hash.hexdigest())

并将此散列作为输出返回：

f7f205b5b844bf57f5f51685969e0df0

如果有人能在SAS中为那个数据集复制这个最终的散列值，那就太好了

PS我在SAS V9.2上

您有两个选择：

在SAS中实现MD5算法。我知道SHA和CRC的现有实现，但我不确定MD5
从SAS调用外部实用程序来计算文件的md5哈希。有一个例子

您有两种选择：

在SAS中实现MD5算法。我知道SHA和CRC的现有实现，但我不确定MD5
从SAS调用外部实用程序来计算文件的md5哈希。有一个例子

data test;
  length x $30000;
  x = repeat('-', 30000);
run;

data _null_;
  set test;
  format m $hex32.;
  m = md5(catx(',', x, x));
  put m=;
run;`

%let reclen = 201; /* Length of each record */
%let records = 2000; /* Number of records */
%let totlen = %eval(&reclen * &records);

proc ds2;
data _null_;
   retain m;
   dcl char(&totlen) m;
   method run();
      dcl char(200) c;
      set shoes;
      c = catx(',',&varstr2);
      m = strip(m)|| strip(c);
   end;
   method term();
      dcl char(32) hh;
      hh = put(md5(m), $hex32.);
      put hh=;
   end;
enddata;
run;
quit;

update

data test;
  length x $30000;
  x = repeat('-', 30000);
run;

data _null_;
  set test;
  format m $hex32.;
  m = md5(catx(',', x, x));
  put m=;
run;`

%let reclen = 201; /* Length of each record */
%let records = 2000; /* Number of records */
%let totlen = %eval(&reclen * &records);

proc ds2;
data _null_;
   retain m;
   dcl char(&totlen) m;
   method run();
      dcl char(200) c;
      set shoes;
      c = catx(',',&varstr2);
      m = strip(m)|| strip(c);
   end;
   method term();
      dcl char(32) hh;
      hh = put(md5(m), $hex32.);
      put hh=;
   end;
enddata;
run;
quit;

update

proc ds2