Python 如何将熊猫系列转换为数据帧
我已经在我拥有的数据帧上运行了一些分组,并将结果保存在变量中。然而,我只是注意到变量实际上被保存为系列而不是数据帧 我看过关于如何将序列转换为数据帧的教程/文档,但它们都只显示静态数据(通过手动将每个值键入数组),这不是我的选项,因为我的数据帧中有200多万行 所以如果我有Python 如何将熊猫系列转换为数据帧,python,pandas,dataframe,plot,Python,Pandas,Dataframe,Plot,我已经在我拥有的数据帧上运行了一些分组,并将结果保存在变量中。然而,我只是注意到变量实际上被保存为系列而不是数据帧 我看过关于如何将序列转换为数据帧的教程/文档,但它们都只显示静态数据(通过手动将每个值键入数组),这不是我的选项,因为我的数据帧中有200多万行 所以如果我有 TopCustomers = raw_data.groupby(raw_data['Company'])['Total Records'].sum() Top10Customers = TopCustomers.sort_v
TopCustomers = raw_data.groupby(raw_data['Company'])['Total Records'].sum()
Top10Customers = TopCustomers.sort_values().tail(10)
如何将10大客户转变为数据帧?我需要它,因为并不是所有的情节都与系列有关
语法
frame={'Col 1':series1,'Col 2':series2}
不起作用,因为我只有1个系列您可以使用.to_frame()
方法,它会将其转换为pd.DataFrame
这里是一个包含数据的小示例:
import pandas as pd
raw_data = pd.DataFrame({'Company':['A', 'A','B', 'B', 'C', 'C'], 'Total Records':[2,3,6,4,5,10]})
TopCustomers = raw_data.groupby(raw_data['Company'])['Total Records'].sum()
实际上类型(TopCustomers)
是pandas.core.series.series
以下内容将其转换为数据帧:
pd.DataFrame(TopCustomers)
否则,
.to_frame()
的工作原理与上述相同。我认为您可以使用以下命令:pd.DataFrame(topcusters.sort_values().tail(10))
Top10CustomersDF=pandas.DataFrame({'Customers':Top10Customers.index,'Total Records':Top10Customers.values})
并将其对齐,这是因为公司
当前是索引。如果是这样,您需要的是TOP10客户。重置索引()
。