Python 如何获取最常用的组合(一组值,以及CSV文件中的计数作为输入)

Python 如何获取最常用的组合(一组值,以及CSV文件中的计数作为输入),python,python-3.x,Python,Python 3.x,我有一个包含乘客旅行数据的CSV文件: 现在使用这个CSV文件作为输入,我们需要找到最流行的旅行 开始时间结束时间行程持续时间开始站结束站用户类型性别出生年份 2017年1月1日0:00 2017年1月1日0:06 356运河街和泰勒街运河街和门罗街客户 2017年1月1日0:02 2017年1月1日0:08 327拉拉比街和门诺莫尼街谢菲尔德大道和金斯伯里街1984 2017年1月1日0:06 2017年1月1日0:18 745奥尔良街和栗子街下一站阿什兰大道和黑鹰街1985 2017年1月

我有一个包含乘客旅行数据的CSV文件:

现在使用这个CSV文件作为输入,我们需要找到最流行的旅行

开始时间结束时间行程持续时间开始站结束站用户类型性别出生年份 2017年1月1日0:00 2017年1月1日0:06 356运河街和泰勒街运河街和门罗街客户

2017年1月1日0:02 2017年1月1日0:08 327拉拉比街和门诺莫尼街谢菲尔德大道和金斯伯里街1984

2017年1月1日0:06 2017年1月1日0:18 745奥尔良街和栗子街下一站阿什兰大道和黑鹰街1985

2017年1月1日0:07 2017年1月1日0:12 323富兰克林街和门罗街克林顿街和蒂尔登街1990*

*def popular_trip(csv_file):

'''TODO: fill out docstring with description, arguments, and return values.
Question: What is the most popular trip?
'''
# TODO: complete function*
输出:

第四点

独特的3

从a到e

频率2

数据类型:对象

most_popular_trip = trip_series.describe()["top"]
print(most_popular_trip)

输出:“a到e”

屏幕截图没有帮助,您可以将csv的同一部分复制/粘贴到您的问题中吗?您的问题不符合指导原则。太宽,没有最小、完整、可复制的示例。然而,python中的数据建模最好使用pandas库来处理,因此不妨继续阅读文档并从那里开始。您如何定义流行的旅行?直觉上,我猜,起点站和终点站的最大重复值是最著名的旅行。你还有什么其他标准来定义流行之旅吗?@AbhijitBalaji-是的。。。。你是对的。。。。。起点站和终点站组合的最大重复次数将被称为最受欢迎的。。。。。示例-行程为->A-B/A-C/A-D/A-B/B-D。。。。那么A-B是最受欢迎的2种情况谢谢你的代码,bt我的疑问是。。。。。。如果我们有n个开始和结束元素呢?这里我们手动添加为a、b、c。。。。我们不知道输入csv文件中的bt唯一源站和目的站及其计数。在这种情况下,我们应该如何进行?我们没有手动添加它们,我们只是告诉pandas创建一个名为trip_series的系列,以包含上述两列的所有元素。df[start]和df[end]指定列,因此即使列中有n个条目,它也可以工作
most_popular_trip = trip_series.describe()["top"]
print(most_popular_trip)