SAS:在PROC导出中限制变量

SAS:在PROC导出中限制变量,sas,Sas,我有一个PROC导出问题,不知您能否回答 我有一个包含800多个变量和超过200K个观测值的SAS数据集,我正在尝试将变量子集导出到CSV文件(即,我需要所有记录;我只是不需要所有800多个变量)。我总是可以创建一个临时数据集“保留”我需要的字段,并在该临时数据集上运行导出,但我试图避免额外的步骤,因为我有大量记录 演示这一点,考虑一个具有三个变量的数据集,称为x、y和z。但是,我希望通过PROC EXPORT生成的文本文件只包含x和y。我尝试下面的解决方案不太管用 SAS代码 当我运行下面的代

我有一个PROC导出问题,不知您能否回答

我有一个包含800多个变量和超过200K个观测值的SAS数据集,我正在尝试将变量子集导出到CSV文件(即,我需要所有记录;我只是不需要所有800多个变量)。我总是可以创建一个临时数据集“保留”我需要的字段,并在该临时数据集上运行导出,但我试图避免额外的步骤,因为我有大量记录

演示这一点,考虑一个具有三个变量的数据集,称为x、y和z。但是,我希望通过PROC EXPORT生成的文本文件只包含x和y。我尝试下面的解决方案不太管用

SAS代码

当我运行下面的代码时,我并没有得到我所需要的。如果运行此代码并查看生成的文本文件,则它在每行末尾都有一个逗号,并且头包含数据集中的所有变量。此外,我在日志中收到一些我不应该收到的消息

data ds1;
      do x = 1 to 100;
            y = x * x;
            z = x * x * x;
            output;
      end;
run;

proc export data=ds1(keep=x y)
      file='c:\test.csv'
      dbms=csv
      replace;
quit;
以下是生成的文本文件(“C:\test.csv”)的前几行

SAS日志

9343  proc export data=ds1(keep=x y)
9344      file='c:\test.csv'
9345      dbms=csv
9346      replace;
9347  quit;

9348   /**********************************************************************
9349   *   PRODUCT:   SAS
9350   *   VERSION:   9.2
9351   *   CREATOR:   External File Interface
9352   *   DATE:      30JUL12
9353   *   DESC:      Generated SAS Datastep Code
9354   *   TEMPLATE SOURCE:  (None Specified.)
9355   ***********************************************************************/
9356      data _null_;
9357      %let _EFIERR_ = 0; /* set the ERROR detection macro variable */
9358      %let _EFIREC_ = 0;     /* clear export record count macro variable */
9359      file 'c:\test.csv' delimiter=',' DSD DROPOVER lrecl=32767;
9360      if _n_ = 1 then        /* write column names or labels */
9361       do;
9362         put
9363            "x"
9364         ','
9365            "y"
9366         ','
9367            "z"
9368         ;
9369       end;
9370     set  DS1(keep=x y)   end=EFIEOD;
9371         format x best12. ;
9372         format y best12. ;
9373         format z best12. ;
9374       do;
9375         EFIOUT + 1;
9376         put x @;
9377         put y @;
9378         put z ;
9379         ;
9380       end;
9381      if _ERROR_ then call symputx('_EFIERR_',1);  /* set ERROR detection macro variable */
9382      if EFIEOD then call symputx('_EFIREC_',EFIOUT);
9383      run;

NOTE: Variable z is uninitialized.
NOTE: The file 'c:\test.csv' is:
      Filename=c:\test.csv,
      RECFM=V,LRECL=32767,File Size (bytes)=0,
      Last Modified=30Jul2012:12:05:02,
      Create Time=30Jul2012:12:05:02

NOTE: 101 records were written to the file 'c:\test.csv'.
      The minimum record length was 4.
      The maximum record length was 10.
NOTE: There were 100 observations read from the data set WORK.DS1.
NOTE: DATA statement used (Total process time):
      real time           0.04 seconds
      cpu time            0.01 seconds


100 records created in c:\test.csv from DS1.


NOTE: "c:\test.csv" file was successfully created.
NOTE: PROCEDURE EXPORT used (Total process time):
      real time           0.12 seconds
      cpu time            0.06 seconds
有没有办法解决这个问题?我正在Windows7上运行SAS 9.2

任何帮助都将不胜感激。谢谢

  • 卡提克

根据伊齐对我的问题的评论,这里是答案,这正是我需要的

proc sql;
    create view vw_ds1 as 
        select x, y from ds1;
quit;

proc export data=vw_ds1
    file='c:\test.csv'
    dbms=csv
    replace;
quit;

谢谢你的帮助

我意识到我可以使用“data null;set ds1;file'c:\test.csv'dlm=',';put x y;run;”来实现这一点。PROC导出看起来很有吸引力,因为明天我可能需要导出到excel工作簿,而不是CSV文件,“数据步骤”选项将不起作用。我不知道这是否有效,因此我将其作为评论发布。您可以只使用数据视图创建所需的子集,然后将其导出吗?我是说,你能导出一个视图吗?我不确定…这真是个奇迹!我将把它作为解决方案发布。谢谢。请注意,数据集选项在导出到分隔文件(如csv)时不起作用,但在导出到Excel时起作用。
proc sql;
    create view vw_ds1 as 
        select x, y from ds1;
quit;

proc export data=vw_ds1
    file='c:\test.csv'
    dbms=csv
    replace;
quit;