可以用python或类似sql查询的东西通过pandas编写sql查询吗?
我有一个疑问:可以用python或类似sql查询的东西通过pandas编写sql查询吗?,python,sql-server,pandas,Python,Sql Server,Pandas,我有一个疑问: SELECT count(PROVIDER_ID) NumOfProviders,SUM(GROSS_AMT) TotalPaid,SERVICE_TYPE FROM [FD_Stage].[dbo].[tbl_claim_services] where SERVICE_TYPE is not null group by SERVICE_TYPE 我可以在熊猫中做类似的事情吗?我已经找到了一种方法 所以在有了我的数据帧和一些属性之后,比如“成员代码”、“sdl代码”、“提供者
SELECT count(PROVIDER_ID) NumOfProviders,SUM(GROSS_AMT) TotalPaid,SERVICE_TYPE
FROM [FD_Stage].[dbo].[tbl_claim_services]
where SERVICE_TYPE is not null
group by SERVICE_TYPE
我可以在熊猫中做类似的事情吗?我已经找到了一种方法 所以在有了我的数据帧和一些属性之后,比如“成员代码”、“sdl代码”、“提供者ID”、“总金额” 我会做下一步
df= rn.read_sql(sql,conn)
df_groupBy= df.groupby(['MEMBER_CODE','sdl_code','PortalDays']).agg({'PROVIDER_ID':'count','GROSS_AMT':'sum'})
希望这可以帮助任何人您可以使用PandaSQL
>>> import pandas as pd
>>> from pandasql import sqldf, load_meat, load_births
>>> pysqldf = lambda q: sqldf(q, globals())
>>> meat = load_meat()
>>> births = load_births()
>>> print pysqldf("SELECT * FROM meat LIMIT 10;").head()
date beef veal pork lamb_and_mutton broilers other_chicken turkey
0 1944-01-01 00:00:00 751 85 1280 89 None None None
1 1944-02-01 00:00:00 713 77 1169 72 None None None
2 1944-03-01 00:00:00 741 90 1128 75 None None None
3 1944-04-01 00:00:00 650 89 978 66 None None None
4 1944-05-01 00:00:00 681 106 1029 78 None None None
Github Repo:您想使用pandas从数据库中获取一些数据(pandas内部使用此查询),还是您已经有数据并希望对其进行筛选和分组?@Piotrek否我有整个表的数据框,我想在它上执行类似的查询是否有帮助?看起来pandasql可能会有所帮助。