Pandas 对于多个实例,具有约束的值计数

Pandas 对于多个实例,具有约束的值计数,pandas,dataframe,jupyter-notebook,kaggle,Pandas,Dataframe,Jupyter Notebook,Kaggle,使用Kaggle的葡萄酒评论数据。我可以使用value_counts()按种类返回出现的次数 然而,我正试图找到一种快速的方法,将结果限制在品种和它们的数量上,在这些品种和数量上有不止一次出现 正在尝试df.loc[df['variation'].value\u counts()>1].value\u counts() 和df['variation'].loc[df['variation'].value\u counts()>1].value\u counts() 两者都返回错误 结果可以转化

使用Kaggle的葡萄酒评论数据。我可以使用value_counts()按种类返回出现的次数

然而,我正试图找到一种快速的方法,将结果限制在品种和它们的数量上,在这些品种和数量上有不止一次出现

正在尝试
df.loc[df['variation'].value\u counts()>1].value\u counts()
df['variation'].loc[df['variation'].value\u counts()>1].value\u counts()
两者都返回错误

结果可以转化为数据帧,并在其中添加约束,但有些东西告诉我,有一种更优雅的方法可以实现这一点


@温家宝在评论中回答了这个问题

df['variety'].value_counts().loc[lambda x : x>1] 

试试df['variation'].value_counts().loc[lambda x:x>1]@wen就是这样做的。您是否有以这种方式使用lambda的资源链接?或者我应该问问。在使用聚合函数时,是否可以使用带有loc的lambda表达式作为结果的约束?这个答案可以从一点解释中受益。我认为这提供了问题的答案。作者试图找到一个快速的线性筛选出这些独特的数据,并只看到超过1个品种的数据。这真的很好!谢谢