Python 我可以为这个大型excel文件数据集运行什么样的分析？_Python_Excel_Pandas_Pivot Table_Analytics

Python 我可以为这个大型excel文件数据集运行什么样的分析？

python excel pandas

Python 我可以为这个大型excel文件数据集运行什么样的分析？,python,excel,pandas,pivot-table,analytics,Python,Excel,Pandas,Pivot Table,Analytics,我在一家向顾客出售水桶的公司工作。我这样做是为了一个类项目，但在Python方面我不是最好的。该文件列出了2015-2019年间购买不同类型水桶的数千名客户。我的财务部门想知道谁在返还，谁没有返还，返还率是多少？我设法使用python只使用与我的分析相关的选定列（）。一旦我导出到csv文件，我应该在Python中运行什么样的分析来帮助回答我的问题？我已经做了一个数据透视表和图表（计算有多少客户返回桶和哪一年），但是我想使用Python使阅读和分析变得更简单，这样我就可以回答这个问题了 impo

我在一家向顾客出售水桶的公司工作。我这样做是为了一个类项目，但在Python方面我不是最好的。该文件列出了2015-2019年间购买不同类型水桶的数千名客户。我的财务部门想知道谁在返还，谁没有返还，返还率是多少？

我设法使用python只使用与我的分析相关的选定列（）。一旦我导出到csv文件，我应该在Python中运行什么样的分析来帮助回答我的问题？我已经做了一个数据透视表和图表（计算有多少客户返回桶和哪一年），但是我想使用Python使阅读和分析变得更简单，这样我就可以回答这个问题了

import pandas as pd

data = pd.read_excel (r'C:\Users\Vilma\Documents\CIS450\Inidividual project\ContainerTracker.xlsx',
sheet_name='2015-2019') 
df = pd.DataFrame(data, columns= ['Customer for Tracking::CustomerName',
          'Customer for Tracking::CustomerID',
          'Order for Tracking::OrderDate',
          'Products for Tracking::ProdName',
          'Transaction Items for Tracking::Description',
          'RemovalNote',
          'RemovalDate',
          'OrderID'])


df.to_csv(r'C:\Users\Vilma\Documents\CIS450\Inidividual project\ContainerTrackerTrimmed.csv',index = False)
print (df)

请阅读我关于发布一个可复制问题的评论，并附上示例，我们可以复制、粘贴并提出解决方案

话虽如此，如果我理解正确，我相信

.groupby（）

函数可能会帮助您：

# fill your black entries with something like No Return

df = df[df['RemovalNote'] == ''] = 'No Return' # fill empty rows

df1 = df.groupby('Customer for Tracking::CustomerName')['RemovalNote'].value_counts()

print(df1)

尽管您的问题非常模糊，但我希望这能有所帮助。

您好，请阅读关于如何发布可复制问题的文章。