Python 如何从数据集中提取信息并使其成为新的数据集?

Python 如何从数据集中提取信息并使其成为新的数据集?,python,pandas,jupyter-notebook,Python,Pandas,Jupyter Notebook,我有一个数据集,它有许多列,按以下顺序排列:英语名称、国家、濒危程度、讲英语的人数 在濒危程度下,有4级脆弱、绝对濒危、严重濒危和灭绝 我想将数据集按这些类别进行排序,并使其成为自己的数据集,同时将其他数据保留在其他列中 在jupyter笔记本上加载我的数据集-这是我所能做到的 如果os.path.isfile(“data.csv”): filepath=“data.csv” df=pd.read\u csv(文件路径) 测向头(300) 但我认为代码应该是这样的: vulnerable =

我有一个数据集,它有许多列,按以下顺序排列:英语名称、国家、濒危程度、讲英语的人数

在濒危程度下,有4级脆弱、绝对濒危、严重濒危和灭绝

我想将数据集按这些类别进行排序,并使其成为自己的数据集,同时将其他数据保留在其他列中

在jupyter笔记本上加载我的数据集-这是我所能做到的

如果os.path.isfile(“data.csv”):
filepath=“data.csv”
df=pd.read\u csv(文件路径)
测向头(300)

但我认为代码应该是这样的:

vulnerable = df[]

你的意思是你想要一个数据框来描述每一个危险程度吗

以下是“易受攻击”的示例:

这是因为

df['Degree of endangerment'] == 'vulnerable'

根据它是否等于vulnerable给出一系列正确或错误
df[series\u of \u true\u or \u falses]
返回原始数据帧的副本,该副本仅包含
series\u of \u true\u or \u falses
true
的索引。除了ojunk发布的内容外,另一种方法是使用:

输出:

       Degree
0  vulnerable

输出仅包含易受攻击的数据集

请检查和。不要将数据帧作为图像发布,而应作为文本发布。
import pandas as pd
df = pd.DataFrame({'Degree' : ['vulnerable', 'not vulnerable', 'endangered']})
vulnerable_df = df[df['Degree'].isin(['vulnerable'])]
       Degree
0  vulnerable