Python 如何在Pyechart或其他文件中显示熊猫的每日直方图?
根据这一点,我想在7月份通过id获得项目在总金额中的比例,我使用与问题相同的数据集:Python 如何在Pyechart或其他文件中显示熊猫的每日直方图?,python,pandas,dataframe,Python,Pandas,Dataframe,根据这一点,我想在7月份通过id获得项目在总金额中的比例,我使用与问题相同的数据集: id date num name type price 0 1 7/6/2020 10 pen abcd $1 1 1 7/6/2020 2 abc efg $3 2 1 7/6/2020 3 bcd efg $5 3 2 7/6/2020 3 pen
id date num name type price
0 1 7/6/2020 10 pen abcd $1
1 1 7/6/2020 2 abc efg $3
2 1 7/6/2020 3 bcd efg $5
3 2 7/6/2020 3 pen abcd $1
4 2 7/6/2020 1 pencil abcd $3
5 2 7/6/2020 2 disk abcd $1
6 2 7/6/2020 2 paper abcd $1
7 3 7/6/2020 2 ff pag $100
8 3 7/6/2020 10 water kml $5
9 4 7/15/2020 5 gg kml $5
10 4 7/15/2020 10 cofffee oo $5
11 5 7/15/2020 5 pp oo $4
12 6 7/15/2020 2 abc efg $3
13 6 7/15/2020 3 bcd efg $5
14 6 7/15/2020 4 aa efg $5
15 6 7/15/2020 5 bb efg $6
16 7 7/15/2020 1 bag abcd $50
17 7 7/15/2020 1 box abcd $20
18 8 7/15/2020 1 pencil abcd $3
19 8 7/15/2020 2 disk abcd $1
20 8 7/15/2020 2 paper abcd $1
21 8 7/15/2020 2 ff hijk $100
22 9 8/15/2020 10 water kml $5
23 9 8/15/2020 5 gg kml $5
24 9 8/15/2020 10 cofffee oo $5
25 9 8/15/2020 5 pp oo $4
26 9 8/15/2020 2 abc efg $3
27 10 8/15/2020 3 bcd efg $5
28 10 8/15/2020 4 aa efg $5
29 10 8/15/2020 5 bb efg $6
30 11 8/15/2020 1 bag abcd $50
31 11 8/15/2020 1 box abcd $20
我想用Pyechart或其他字体显示总金额的每日直方图,类似于,下面的代码不正确
import pandas as pd
import xlrd
import seaborn as sns
import matplotlib.pyplot as plt
df = pd.read_excel ('./orders.xlsx', sheet_name='Sheet1')
df.groupby(by=['type']).sum()
df['price'] = df['price'].replace('$','', regex=True).astype(int)
df['new'] = df['price'].mul(df['num'])
df1 = df.groupby(by=['name'], as_index=False)['new'].sum()
# df1
# df1['new'] = df1.apply(lambda x: x.sum(), axis=1)
# df1.loc['new'] = df1.apply(lambda x: x.sum()).dropna()
非常感谢您的建议。首先,我建议使用
datetime
类型来处理日期/时间:
df['date'] = pd.to_datetime(df['date'])
现在,为了回答您的问题,如果您只需要7月份的数据,可以使用以下方法提取:
July_df = df[df['date'].dt.to_period('M')=='2020-07'].copy()
您可以继续绘制July\u df
如果要每月打印,可以使用groupby
:
df['total']=df['price'].str.replace('$','').astype(float)*df['num']
(df.groupby([pd.Grouper(key='date',freq='M'),'name'])['total'].sum()
.reset_index(level='date')
.groupby('date')
.plot.pie(subplots=True, autopct='%.2f%%')
)
你会得到两个这样的图:
如果迭代groupby,还可以添加更多格式:
# notice the difference in first groupby
groups = (df.groupby([df.date.dt.strftime('%b-%Y'),'name'])['total'].sum()
.reset_index(level='date')
.groupby('date')
)
fig, axes = plt.subplots(1,2, figsize=(10,5))
for ax, (month, data) in zip(axes, groups):
data['total'].plot.pie(autopct='%.2f%%', ax=ax)
ax.set_title(f'data in {month}')
输出:
你能详细说明你想做什么吗?你知道如何选择七月的数据吗?@ShubhamSharma我现在只需要按月选择数据帧。我想你可以试试
July\u df=df[pd.to\u datetime(df['date']).dt month.eq(7)]。copy()
Happy coding。。!您好,非常感谢您的详细回答,我想显示直方图一样的屏幕截图,我已经更新了我的问题,再次感谢阅读我的问题。