Python 使用熊猫汇总和绘制数据
我想用pandas来总结或形象化我的数据中的一些有用的总结,以强调供应商如何偏离订单的供货日期。以下是我的数据框的一个片段:Python 使用熊猫汇总和绘制数据,python,pandas,Python,Pandas,我想用pandas来总结或形象化我的数据中的一些有用的总结,以强调供应商如何偏离订单的供货日期。以下是我的数据框的一个片段: Supplier TimeDiff (days) A 3 days B 4 days B 12 days A 0 days C 1 days B 2 days D 3 days E 5 days E 7 days “供应商”列包含供应商代码,“TimeDiff”列包含时差(从“订单接收日期”中减去“订单到期日期”获得的日期范围)
Supplier TimeDiff (days)
A 3 days
B 4 days
B 12 days
A 0 days
C 1 days
B 2 days
D 3 days
E 5 days
E 7 days
“供应商”列包含供应商代码,“TimeDiff”列包含时差(从“订单接收日期”中减去“订单到期日期”获得的日期范围)
有人知道我如何最好地总结这些数据吗?谢谢我首先计算供应商的平均时间差:
import matplotlib.pyplot as plt
import pandas as pd
df = pd.DataFrame([['A', '3 days'], ['B', '4 days'], ['B', '12 days'], ['A', '0 days']], columns=['Supplier', 'TimeDiff'])
df['TimeDiff'] = df['TimeDiff'].str.extract(r'(\d+)').astype(int)
print df.groupby('Supplier').mean()
TimeDiff
Supplier
A 1.5
B 8.0
res.plot.bar()
plt.show()
我首先计算供应商的平均时间差:
import matplotlib.pyplot as plt
import pandas as pd
df = pd.DataFrame([['A', '3 days'], ['B', '4 days'], ['B', '12 days'], ['A', '0 days']], columns=['Supplier', 'TimeDiff'])
df['TimeDiff'] = df['TimeDiff'].str.extract(r'(\d+)').astype(int)
print df.groupby('Supplier').mean()
TimeDiff
Supplier
A 1.5
B 8.0
res.plot.bar()
plt.show()
你能说得更具体些吗?你想从这些数据中学到什么?例如,您可以获得每个供应商的平均“TimeDiff”,如下所示:
data.groupby('supplier').mean()['TimeDiff']
您可以更具体一点吗?你想从这些数据中学到什么?例如,您可以获得每个供应商的平均“TimeDiff”,如下所示:data.groupby('supplier').mean()['TimeDiff']
感谢大家提供这些解决方案。我想知道是否有可能直接计算条形图。谢谢你们提供这些解决方案。我想知道是否有可能直接计算条形图。