pandas HDFStore:sql“分组依据”等效项

pandas HDFStore:sql“分组依据”等效项,sql,pandas,pytables,hdfstore,Sql,Pandas,Pytables,Hdfstore,我正在尝试将以下SQL查询转换为在大型HDFStore上运行: SELECT * FROM mytable JOIN ( SELECT col1, col2, col3, max(colN) as maxColN FROM mytable GROUP BY col1, col2, col3 ) m ON m.col1=mytable.col1 AND m.col2=mytable.col2 AND m.col3=mytable.col3 WHERE colN=maxColN 实现这

我正在尝试将以下SQL查询转换为在大型HDFStore上运行:

SELECT * FROM mytable
JOIN (
  SELECT col1, col2, col3, max(colN) as maxColN
  FROM mytable
  GROUP BY col1, col2, col3
) m
ON m.col1=mytable.col1 AND m.col2=mytable.col2 AND m.col3=mytable.col3
WHERE colN=maxColN

实现这一点的最佳方式是什么?我有关于col1、col2、col3的索引。

您的查询不是正确的SQL语法。它将返回一个错误,因此,基本上,任何返回错误的查询字符串都会给出类似的结果。也许你应该解释一下你想做什么。@GordonLinoff谢谢你指出这一点。我修复了sql查询以实际描述我想要做的事情。基本上:为每个col1、col2、col3组合查找包含colN最大值的行。