在proc sql中，当使用SELECT*和GROUP BY时，结果不会折叠_Sql_Sas

在proc sql中，当使用SELECT*和GROUP BY时，结果不会折叠

sql sas

在proc sql中，当使用SELECT*和GROUP BY时，结果不会折叠,sql,sas,Sql,Sas,当将星号与sum和group组合使用时，重复项不会像我预期的那样被删除（例如在mysql中）：返回的数据是： col1 | country | s -------------------- 5 | sweden | 25 20 | sweden | 25 30 | denmark | 30 而不是我所期望的： col1 | country | s ------------------------ 5 | sweden | 25 30 | denmark | 30

当将星号与sum和group组合使用时，重复项不会像我预期的那样被删除（例如在mysql中）：

返回的数据是：

col1 | country | s
--------------------
5    | sweden  | 25
20   | sweden  | 25
30   | denmark | 30

而不是我所期望的：

col1 | country | s
------------------------
5    | sweden  | 25
30   | denmark | 30

如果不使用星号（*），则返回的数据与我预期的一样

SELECT country, sum(col1) as s from table

您是正确的，当语句中的变量不在GROUP BY语句中时，SAS不会崩溃。日志中会有一个关于合并数据的注释

如果您只需要这些变量，很遗憾，您必须列出它们，但由于您必须按组列出它们，因此这本身并不是额外的工作

不同的SQL实现处理事情的方式不同，这是SAS不同的一种方式。但是，当您确实希望将摘要统计数据与主数据集合并时，它非常方便

如果您不希望出现这种行为，请将NOREMERGE选项添加到PROC SQL中，但它会抛出一个错误，仍然无法按您希望的方式工作。

您是正确的，当语句中的变量不在GROUP BY语句中时，SAS不会崩溃。日志中会有一个关于合并数据的注释

如果您只需要这些变量，很遗憾，您必须列出它们，但由于您必须按组列出它们，因此这本身并不是额外的工作

不同的SQL实现处理事情的方式不同，这是SAS不同的一种方式。但是，当您确实希望将摘要统计数据与主数据集合并时，它非常方便

如果您不希望出现这种行为，请将NOREMERGE选项添加到PROC SQL中，但它会抛出一个错误，仍然无法按您希望的方式工作。

永远不要使用

选择*

。这是坏习惯，有风险，不可持续。。。读一读

什么样的SQL

您的第一个查询不应该起作用。你基本上是说

select col1
, country
, sum(col1) as s
from table
group by country

…将返回一个错误：

列“table.col1”在选择列表中无效，因为它不包含在聚合函数或GROUP BY子句中。

SELECT country, sum(col1) as s from table

…也不应该起作用：

列“table.country”在选择列表中无效，因为它未包含在聚合函数或GROUP BY子句中。

SELECT country, sum(col1) as s from table

考虑到你的预期产出，我怀疑你想要的是

select min(col1) as col1
, country
, sum(col1) as s
from table
group by country