Python 数据帧中的过滤
我将导演的烂番茄分数与以下内容进行分组:Python 数据帧中的过滤,python,pandas,Python,Pandas,我将导演的烂番茄分数与以下内容进行分组: director_counts = bigbadpanda.groupby(["Director"]).size().order(ascending = False) print director_counts ---> Director Woody Allen 44 Alfred Hitchcock 38 Clint Eastwood 32 Martin Scorsese
director_counts = bigbadpanda.groupby(["Director"]).size().order(ascending = False)
print director_counts --->
Director
Woody Allen 44
Alfred Hitchcock 38
Clint Eastwood 32
Martin Scorsese 29
Steven Spielberg 29
Sidney Lumet 25
...
问题:
对于我来说,哪种最好的方式可以让导演们筛选出2部以上的电影
按每位导演的平均电影数进行过滤,这样做行吗
bigbadpanda.groupby([“Director”]).size().mean()
)我根据您的信息创建的数据
Director,Movies
Woody Allen,44
Alfred Hitchcock,38
Clint Eastwood,32
Someone,2
Someone else,1
只需这样做:
df = pd.read_csv('data.txt')
print(df[df.Movies > 2])
输出:
Director Movies
0 Woody Allen 44
1 Alfred Hitchcock 38
2 Clint Eastwood 32
你能在这里发布源数据吗?可能有一种更为优化的方法来完成您的工作。我刚刚在“过滤”下查看了文档。试试这个:
director\u counts.groupby(director\u counts[“director”])。filter(lambda:x:x>2)
用于按>2部电影进行筛选。我将在一秒钟内对此进行补充