Python 如何根据列表中每个子项的长度制作布尔掩码?或者我如何过滤掉所有长度超过x的字符串?

Python 如何根据列表中每个子项的长度制作布尔掩码?或者我如何过滤掉所有长度超过x的字符串?,python,pandas,Python,Pandas,我有一个亚马逊电影评论的数据集。然而,我发现一些电影的名字已经被破坏,只是一个巨大的混乱。由于数据集相当大,我需要以某种方式过滤掉这些名称。我的想法是,因为我用眼睛看到的电影大约有1页长(即namnes),可以删除所有名称为len(Data[“title”]>200)的电影 我试着通过对df进行切片来获得asin(ID)来完成这项工作,该文档包含以下代码 titlesData.loc[len(titlesData["title"]) > 200, "asin"] 但是由于len(titl

我有一个亚马逊电影评论的数据集。然而,我发现一些电影的名字已经被破坏,只是一个巨大的混乱。由于数据集相当大,我需要以某种方式过滤掉这些名称。我的想法是,因为我用眼睛看到的电影大约有1页长(即namnes),可以删除所有名称为
len(Data[“title”]>200
)的电影

我试着通过对
df
进行切片来获得
asin
(ID)来完成这项工作,该文档包含以下代码

titlesData.loc[len(titlesData["title"]) > 200, "asin"]
但是由于
len(titlesData[“title”])>200
没有创建我想要的掩码,而是返回true,因为
df
有200多行,所以我当前需要一些帮助

尝试以下方法:

titlesData.loc[len(titlesData["title"].str) < 200]
试试这个:

titlesData.loc[len(titlesData["title"].str) < 200]
用于按字母长度过滤:

titlesData.loc[titlesData["title"].str.len() > 200, "asin"]
用于按字母长度过滤:

titlesData.loc[titlesData["title"].str.len() > 200, "asin"]

您可以尝试使用
map

titlesData.loc[titlesData["title"].map(len) > 200, "asin"]

您可以尝试使用
map

titlesData.loc[titlesData["title"].map(len) > 200, "asin"]