Statistics 按年龄范围对SAS健康数据进行分层

Statistics 按年龄范围对SAS健康数据进行分层,statistics,sas,Statistics,Sas,这是我的数据集 第1栏: 脂质水平 第2栏: 年龄 第3栏: 脂肪含量类别 第4栏: 性别(1=男性) 下面是我用这段代码运行的一些不同的分析,但我不太清楚为什么SAS没有编译 在做其他事情之前,我手动设置了一个永久库 libname di ‘c:\diet’; data di.HW3 Data; infile hw3 data.sas; input Lipidlevel Age Fatcontent Gender; run; 有没有什么方法可以将数据分层如下?我想为年龄组和脂肪含量类别变量创

这是我的数据集

第1栏: 脂质水平

第2栏: 年龄

第3栏: 脂肪含量类别

第4栏: 性别(1=男性)

下面是我用这段代码运行的一些不同的分析,但我不太清楚为什么SAS没有编译

在做其他事情之前,我手动设置了一个永久库

libname di ‘c:\diet’;
data di.HW3 Data;
infile hw3 data.sas;
input Lipidlevel Age Fatcontent Gender;
run;
有没有什么方法可以将数据分层如下?我想为年龄组和脂肪含量类别变量创建标签和格式。年龄组编码为1-5,对应于:15-24;25-34; 35-44; 45-54; 55-64. 脂肪含量类别编码为1至3,对应于:极低;较低,;中等偏低。我不知道怎么做。我能想到的唯一方法是进入原始数据集并手动排序

libname di ‘c:\diet’;
data di.HW3 Data;
infile hw3 data.sas;
input Lipidlevel Age Fatcontent Gender;
run;

我的意思是,当然,如果给我一个更大的数据集,那么这样做是不切实际的。我能在这里得到一些帮助吗

要使用描述性文字显示编码变量,应使用格式。首先定义一些格式

proc format;
  value agegp 1='15-24' 2='25-34' 3='35-44' 4='45-54' 5='55-64';
  value fat   1='extremely low' 2='fairly low' 3='moderately low';
  vale sex '1'='male' ;
run;
然后可以将它们附加到变量。您可以在创建数据集的步骤中执行此操作,也可以将它们附加到您想要使用它们的位置

proc freq data=di.hw3;
  tables age fatcontent gender;
  format age agegp. fatcontent fat. gender sex. ;
run;

您的
infle
语句是错误的。可以包括一个fileref(即别名),如
hw3
,也可以包括一个物理路径,如
“data.sas”
,但不能同时包括这两个路径。还要注意那些没有引用单词或在
libname
语句中生成的内容的字符引号。SAS不懂那些花哨的引语。正常的
引号。您是否在询问如何为编码变量创建格式(SPSS称之为值标签)?使用
PROC FORMAT
创建它们。然后您可以使用
FORMAT
语句告诉SAS哪些格式用于哪些变量。