sas中大数据集的处理

sas中大数据集的处理,sas,Sas,我正在寻找解决方案或想法,如何加快sas中大数据集的处理 你推荐什么 什么是更好的数据步骤或proc-sql过程?我发现proc-sql更适合我的用例。我们可能需要更多关于您尝试加入/导出的数据的大小和种类等的详细信息 给我们一些信息,我们可以尝试帮助 小贴士: 限制停车的场地 子集数据根据我的经验,Proc-SQL似乎更快 以下是有关使用Proc SQL加速查询的两个提示: 通常,在查询时,您希望排除尽可能多的数据。如果您使用的是PROC SQL,where子句中限制的顺序很重要。把最严格的部

我正在寻找解决方案或想法,如何加快sas中大数据集的处理

你推荐什么


什么是更好的数据步骤或proc-sql过程?

我发现proc-sql更适合我的用例。我们可能需要更多关于您尝试加入/导出的数据的大小和种类等的详细信息

给我们一些信息,我们可以尝试帮助

小贴士: 限制停车的场地
子集数据

根据我的经验,Proc-SQL似乎更快

以下是有关使用Proc SQL加速查询的两个提示:

通常,在查询时,您希望排除尽可能多的数据。如果您使用的是PROC SQL,where子句中限制的顺序很重要。把最严格的部分放在第一位

例如,如果我正在查询一个数据库,查找2005年1月之后聘用的姓氏为JONES的教师,我会这样构造我的where子句:where last_name='JONES'和hire_date>200501我会这样做,因为姓氏可能会排除比雇用日期限制更多的记录

如果可能,不要使用Select*,而是列出所需的特定列。请记住,即使使用列进行计算,也不必在select语句中包含该列

这里有一个非常有用的资源,可以帮助您了解如何有效地使用procsql。如果您在SAS中大量使用大型数据集,我建议您完整地阅读它


加快数据处理速度取决于数据保存的位置

您的数据可以是:

SAS表, 数据库表MICROSFOTSQL,Oracle,DB2,MYSQL。。 等 在以下情况下使用SAS数据步骤:

您正在查询/处理SAS表, 你想做什么 处理,例如保留值或使用数组。 在以下情况下使用Proc SQL:

您正在查询一个大型数据库表, 您可以在发送SQL代码的位置执行SQL传递 在DB服务器上执行,只将输出发送到SAS 将整个表通过网络传输到SAS,然后对其进行过滤

您希望查询SAS表,但更喜欢SQL联接而不是数据步骤合并


你应该考虑的另一个主题是效率编程;优化查询和查找的地方。

您具体在做什么样的处理?大量的查询、计算等。?您正在处理关系数据库吗?您已经有了一个良好的开端,但是如果您能够提供更多信息,这将是非常有帮助的。我将投票支持您的问题,因为它仍然足够通用,可以帮助其他sas初学者解决同一问题。