Pandas 对于多个实例，具有约束的值计数_Pandas_Dataframe_Jupyter Notebook_Kaggle

Pandas 对于多个实例，具有约束的值计数

pandas dataframe jupyter-notebook

Pandas 对于多个实例，具有约束的值计数,pandas,dataframe,jupyter-notebook,kaggle,Pandas,Dataframe,Jupyter Notebook,Kaggle,使用Kaggle的葡萄酒评论数据。我可以使用value_counts（）按种类返回出现的次数然而，我正试图找到一种快速的方法，将结果限制在品种和它们的数量上，在这些品种和数量上有不止一次出现正在尝试df.loc[df['variation'].value\u counts（）>1].value\u counts（）和df['variation'].loc[df['variation'].value\u counts（）>1].value\u counts（）两者都返回错误结果可以转化

使用Kaggle的葡萄酒评论数据。我可以使用value_counts（）按种类返回出现的次数

然而，我正试图找到一种快速的方法，将结果限制在品种和它们的数量上，在这些品种和数量上有不止一次出现

正在尝试

df.loc[df['variation'].value\u counts（）>1].value\u counts（）

和

df['variation'].loc[df['variation'].value\u counts（）>1].value\u counts（）

两者都返回错误

结果可以转化为数据帧，并在其中添加约束，但有些东西告诉我，有一种更优雅的方法可以实现这一点

@温家宝在评论中回答了这个问题

df['variety'].value_counts().loc[lambda x : x>1]

试试df['variation'].value_counts（）.loc[lambda x:x>1]@wen就是这样做的。您是否有以这种方式使用lambda的资源链接？或者我应该问问。在使用聚合函数时，是否可以使用带有loc的lambda表达式作为结果的约束？这个答案可以从一点解释中受益。我认为这提供了问题的答案。作者试图找到一个快速的线性筛选出这些独特的数据，并只看到超过1个品种的数据。这真的很好！谢谢