Python 我可以为这个大型excel文件数据集运行什么样的分析?

Python 我可以为这个大型excel文件数据集运行什么样的分析?,python,excel,pandas,pivot-table,analytics,Python,Excel,Pandas,Pivot Table,Analytics,我在一家向顾客出售水桶的公司工作。我这样做是为了一个类项目,但在Python方面我不是最好的。该文件列出了2015-2019年间购买不同类型水桶的数千名客户。我的财务部门想知道谁在返还,谁没有返还,返还率是多少? 我设法使用python只使用与我的分析相关的选定列()。一旦我导出到csv文件,我应该在Python中运行什么样的分析来帮助回答我的问题?我已经做了一个数据透视表和图表(计算有多少客户返回桶和哪一年),但是我想使用Python使阅读和分析变得更简单,这样我就可以回答这个问题了 impo

我在一家向顾客出售水桶的公司工作。我这样做是为了一个类项目,但在Python方面我不是最好的。该文件列出了2015-2019年间购买不同类型水桶的数千名客户。我的财务部门想知道谁在返还,谁没有返还,返还率是多少?

我设法使用python只使用与我的分析相关的选定列()。一旦我导出到csv文件,我应该在Python中运行什么样的分析来帮助回答我的问题?我已经做了一个数据透视表和图表(计算有多少客户返回桶和哪一年),但是我想使用Python使阅读和分析变得更简单,这样我就可以回答这个问题了

import pandas as pd

data = pd.read_excel (r'C:\Users\Vilma\Documents\CIS450\Inidividual project\ContainerTracker.xlsx',
sheet_name='2015-2019') 
df = pd.DataFrame(data, columns= ['Customer for Tracking::CustomerName',
          'Customer for Tracking::CustomerID',
          'Order for Tracking::OrderDate',
          'Products for Tracking::ProdName',
          'Transaction Items for Tracking::Description',
          'RemovalNote',
          'RemovalDate',
          'OrderID'])


df.to_csv(r'C:\Users\Vilma\Documents\CIS450\Inidividual project\ContainerTrackerTrimmed.csv',index = False)
print (df)

请阅读我关于发布一个可复制问题的评论,并附上示例,我们可以复制、粘贴并提出解决方案

话虽如此,如果我理解正确,我相信
.groupby()
函数可能会帮助您:

# fill your black entries with something like No Return

df = df[df['RemovalNote'] == ''] = 'No Return' # fill empty rows

df1 = df.groupby('Customer for Tracking::CustomerName')['RemovalNote'].value_counts()

print(df1)
尽管您的问题非常模糊,但我希望这能有所帮助。

您好,请阅读关于如何发布可复制问题的文章。