Python 熊猫图书馆
我试图过滤一些数据,使用pandas在python上创建一个子集Python 熊猫图书馆,python,python-3.x,pandas,csv,Python,Python 3.x,Pandas,Csv,我试图过滤一些数据,使用pandas在python上创建一个子集 import pandas as pd data = pd.read_csv("movies.csv") PG_13 = data[data.mpaa == "PG-13"] print(PG_13.year.min()) 它可以工作,但它总是返回“nan”,而不是我在子集上寻找的年份 有什么想法吗?你可以在PG\u 13.year中检查你的值,比如PG\u 13.year.value\u counts()。如果您有一些遗漏
import pandas as pd
data = pd.read_csv("movies.csv")
PG_13 = data[data.mpaa == "PG-13"]
print(PG_13.year.min())
它可以工作,但它总是返回“nan”,而不是我在子集上寻找的年份
有什么想法吗?你可以在
PG\u 13.year
中检查你的值,比如PG\u 13.year.value\u counts()
。如果您有一些遗漏(ur nan值),您可以删除它们或按函数填充。您是否检查了PG_13.year
中是否有nan
值以外的内容?(例如,PG_13.year.count()
是否返回非零?检查建议的JonClements的一种方法是print(PG_13['year'].unique())
是的,我已经检查了文件,该列中的所有内容都是整数,但我只是检查了计数,它返回0,因此它没有得到子集的条件,我不知道为什么,len(pgu 13)==0
那么呢?如果是的话-您可能需要执行data.mpaa.value\u counts()
要查看列中的实际值…您可能需要“PG13”或某个PG\u 13.year.value\u counts()
不会给出nan
计数。要获得该值,您必须使用PG\u 13.year.value\u计数(dropna=False)
当我计算它们时,它说里面没有值。我检查了一下,创建文件的人在“PG-13”!=“PG-13”上加了一个额外的空间,所以子集是空的。谢谢你让我知道数据集中是否有东西