Sas 如何从数值与另一个表中数值相似的表中选择行?

Sas 如何从数值与另一个表中数值相似的表中选择行?,sas,Sas,我有一组测试和控制数据。试验组和对照组的表格都有cust_id和NRX数值。测试组中的行只有300行,而控制组有40000行。我需要使用SAS选择300-400行对照组作为另一个表,以便对照组的NRx在合理范围内与试验组的NRx紧密匹配。请帮忙 最好的方法可能是对已排序的控制列表进行第n次采样 在SQL中,可以使用以下构造在某些数据库中执行此操作: select t.* from (select t.*, row_number() over (order by cust_id) as seqnu

我有一组测试和控制数据。试验组和对照组的表格都有cust_id和NRX数值。测试组中的行只有300行,而控制组有40000行。我需要使用SAS选择300-400行对照组作为另一个表,以便对照组的NRx在合理范围内与试验组的NRx紧密匹配。请帮忙

最好的方法可能是对已排序的控制列表进行第n次采样

在SQL中,可以使用以下构造在某些数据库中执行此操作:

select t.*
from (select t.*, row_number() over (order by cust_id) as seqnum
      from t
     ) t
where mod(t, 100) = 7
这将为测试组选择每一百条记录,从第七条开始


大多数数据库支持行数功能。如果您没有,那么您可以在SAS中的数据步骤中轻松地执行相同的操作。

最好的方法可能是执行排序控制列表的第n个样本

在SQL中,可以使用以下构造在某些数据库中执行此操作:

select t.*
from (select t.*, row_number() over (order by cust_id) as seqnum
      from t
     ) t
where mod(t, 100) = 7
这将为测试组选择每一百条记录,从第七条开始


大多数数据库支持行数功能。如果您没有,那么您可以在SAS中的数据步骤中轻松地执行相同的操作。

选择最接近测试组平均值的300。或者,将对照组按试验组的比例装箱,并按试验组的分布比例从箱子中取出样本。

从最接近试验组平均值的300个箱子中挑选样本。或者,将对照组按试验组的比例装箱,并按试验组的分布比例从箱子中取出样本。

首先确定您的选择标准您对合理范围的意见;假设您想要包括来自控制的记录,这些记录在样本平均值的正负一个标准偏差范围内。在不替换的情况下尝试此简单随机样本,请参阅:


请注意,这将创建一个目标数据集,其中包含符合示例条件的记录。将K的值更改为您想要的样本大小。

首先确定您的选择标准以及您对合理范围的评论;假设您想要包括来自控制的记录,这些记录在样本平均值的正负一个标准偏差范围内。在不替换的情况下尝试此简单随机样本,请参阅:


请注意,这将创建一个目标数据集,其中包含符合示例条件的记录。将K的值更改为所需的任何样本大小。

proc sql函数单调将为您提供行号


它不受支持/没有文档记录,因此请勿在生产系统中使用

proc sql函数monotonic将为您提供行号


它不受支持/记录,因此不要在生产系统中使用

是否“合理范围”是一些不同的数字,例如+/-200?测试组的范围是1到400。对照组为1~410。所以,我需要非常紧密地匹配控制组和测试组。“紧密匹配”,这是一个统计术语吗?;-两组的分布是否相同?相同的范围?他们是高斯人吗?您希望控件和子集在分布、中位数、均值或.range中匹配吗?它们具有相似的分布和范围。我希望它们在分布上匹配。“合理范围”是否是一些不同的数字,例如+/-200?测试组的范围是1到400。对照组为1~410。所以,我需要非常紧密地匹配控制组和测试组。“紧密匹配”,这是一个统计术语吗?;-两组的分布是否相同?相同的范围?他们是高斯人吗?您希望控件和子集在分布、中位数、均值或.range中匹配吗?它们具有相似的分布和范围。我希望它们在发行版中匹配。嗨,Gordon,在proc sql中尝试过这个。。但它不起作用。我是SAS的新手。你能用SAS代码解释一下吗?我认为proc sql不支持行数功能。这在数据步代码中很容易做到。也可能有某种proc样本可用。我通常通过EnterpriseMiner使用SAS,它具有第n个示例功能。我不确定它是如何在那里实现的。嗨,戈登,在proc-sql中尝试过这个。。但它不起作用。我是SAS的新手。你能用SAS代码解释一下吗?我认为proc sql不支持行数功能。这在数据步代码中很容易做到。也可能有某种proc样本可用。我通常通过EnterpriseMiner使用SAS,它具有第n个示例功能。我不确定它是如何在那里实施的。