Python 解码数据帧上的查询? 我想在数据帧上解码这个查询。

Python 解码数据帧上的查询? 我想在数据帧上解码这个查询。,python,pandas,Python,Pandas,到目前为止我所理解的 1.代码试图使用多个筛选器从数据帧中选择行 2.然后从结果中选择几列 3.然后根据“calendar\u yearweek”列对结果进行分组 4.然后计算各组的总和。 我的理解正确吗这是对数据帧进行条件选择、分组和执行聚合求和的正确方法吗? 数据帧大小接近1GB,在不久的将来可能会增加到4GB 我怎么会变成这个密码 数据实际上属于mysql中的一个表,但使用sql处理同样的事情需要花费大量时间。 我转向python,认为在pandas中读取整个文件,然后处理将减少时

到目前为止我所理解的
1.代码试图使用多个筛选器从数据帧中选择行
2.然后从结果中选择几列
3.然后根据“calendar\u yearweek”列对结果进行分组
4.然后计算各组的总和。

我的理解正确吗
这是对数据帧进行条件选择、分组和执行聚合求和的正确方法吗?
数据帧大小接近1GB,在不久的将来可能会增加到4GB

我怎么会变成这个密码 数据实际上属于mysql中的一个表,但使用sql处理同样的事情需要花费大量时间。
我转向python,认为在pandas中读取整个文件,然后处理将减少时间。


我现在想知道上述想法是否正确?

我不确定pandas的速度可能会比sql快。您能够在sql中创建索引吗?这可能会有帮助。而且,
filter1
filter2
看起来和我一样……试过了,但时间没有减少。索引可能没有帮助,因为每个查询结果的数据量可能以GB为单位。对我改正了。
 filter1 = df['customer_planning_group'] == 'G01'
 filter3 = df['calendar_yearweek'].between(201929,201939) 
 filter4 = df['SKU_Name'].isin(un_name)
 final_filter = filter1 & filter3 & filter4
 df[['calendar_yearmonth', 'calendar_yearweek','predictions', 'total_sales_volume']].where(final_filter).groupby('calendar_yearweek').sum()