Python 如何根据列表中每个子项的长度制作布尔掩码？或者我如何过滤掉所有长度超过x的字符串？_Python_Pandas

Python 如何根据列表中每个子项的长度制作布尔掩码？或者我如何过滤掉所有长度超过x的字符串？

python pandas

Python 如何根据列表中每个子项的长度制作布尔掩码？或者我如何过滤掉所有长度超过x的字符串？,python,pandas,Python,Pandas,我有一个亚马逊电影评论的数据集。然而，我发现一些电影的名字已经被破坏，只是一个巨大的混乱。由于数据集相当大，我需要以某种方式过滤掉这些名称。我的想法是，因为我用眼睛看到的电影大约有1页长（即namnes），可以删除所有名称为len（Data[“title”]>200）的电影我试着通过对df进行切片来获得asin（ID）来完成这项工作，该文档包含以下代码 titlesData.loc[len(titlesData["title"]) > 200, "asin"] 但是由于len（titl

我有一个亚马逊电影评论的数据集。然而，我发现一些电影的名字已经被破坏，只是一个巨大的混乱。由于数据集相当大，我需要以某种方式过滤掉这些名称。我的想法是，因为我用眼睛看到的电影大约有1页长（即namnes），可以删除所有名称为

len（Data[“title”]>200

）的电影

我试着通过对

df

进行切片来获得

asin

（ID）来完成这项工作，该文档包含以下代码

titlesData.loc[len(titlesData["title"]) > 200, "asin"]

但是由于

len（titlesData[“title”]）>200

没有创建我想要的掩码，而是返回true，因为

df

有200多行，所以我当前需要一些帮助

尝试以下方法：

titlesData.loc[len(titlesData["title"].str) < 200]

试试这个：

titlesData.loc[len(titlesData["title"].str) < 200]

用于按字母长度过滤：

titlesData.loc[titlesData["title"].str.len() > 200, "asin"]

用于按字母长度过滤：

titlesData.loc[titlesData["title"].str.len() > 200, "asin"]

您可以尝试使用

map

titlesData.loc[titlesData["title"].map(len) > 200, "asin"]

您可以尝试使用

map

titlesData.loc[titlesData["title"].map(len) > 200, "asin"]