Python 熊猫图书馆_Python_Python 3.x_Pandas_Csv

Python 熊猫图书馆

python python-3.x pandas csv

Python 熊猫图书馆,python,python-3.x,pandas,csv,Python,Python 3.x,Pandas,Csv,我试图过滤一些数据，使用pandas在python上创建一个子集 import pandas as pd data = pd.read_csv("movies.csv") PG_13 = data[data.mpaa == "PG-13"] print(PG_13.year.min()) 它可以工作，但它总是返回“nan”，而不是我在子集上寻找的年份有什么想法吗？你可以在PG\u 13.year中检查你的值，比如PG\u 13.year.value\u counts（）。如果您有一些遗漏

我试图过滤一些数据，使用pandas在python上创建一个子集

import pandas as pd

data = pd.read_csv("movies.csv")
PG_13 = data[data.mpaa == "PG-13"]

print(PG_13.year.min())

它可以工作，但它总是返回“nan”，而不是我在子集上寻找的年份

有什么想法吗？

你可以在

PG\u 13.year

中检查你的值，比如

PG\u 13.year.value\u counts（）

。如果您有一些遗漏（ur nan值），您可以删除它们或按函数填充。

您是否检查了

PG_13.year

中是否有

nan

值以外的内容？（例如，

PG_13.year.count（）

是否返回非零？检查建议的JonClements的一种方法是

print（PG_13['year'].unique（））

是的，我已经检查了文件，该列中的所有内容都是整数，但我只是检查了计数，它返回0，因此它没有得到子集的条件，我不知道为什么，

len（pgu 13）==0

那么呢？如果是的话-您可能需要执行

data.mpaa.value\u counts（）

要查看列中的实际值…您可能需要“PG13”或某个

PG\u 13.year.value\u counts（）

不会给出

nan

计数。要获得该值，您必须使用

PG\u 13.year.value\u计数（dropna=False）

当我计算它们时，它说里面没有值。我检查了一下，创建文件的人在“PG-13”！=“PG-13”上加了一个额外的空间，所以子集是空的。谢谢你让我知道数据集中是否有东西