Python 线型数据图不';不出现
这是我要绘制的数据集(可以在这里获得)。我想策划2000年至2015年俄罗斯联邦25-34岁的男性和女性自杀事件。所以我为它创建了一个新的数据框架 这是主数据框Python 线型数据图不';不出现,python,dataframe,dataset,Python,Dataframe,Dataset,这是我要绘制的数据集(可以在这里获得)。我想策划2000年至2015年俄罗斯联邦25-34岁的男性和女性自杀事件。所以我为它创建了一个新的数据框架 这是主数据框 DF = pd.read_csv("D:/who_suicide_statistics.csv") DF1 = (DF.loc[(DF["country"] == "Russian Federation") & (DF["age"] == "25-34 years") & (DF["sex"] ==
DF = pd.read_csv("D:/who_suicide_statistics.csv")
DF1 = (DF.loc[(DF["country"] == "Russian Federation") & (DF["age"] == "25-34 years")
& (DF["sex"] == "male") & (DF["year"] >= 2000)])
DF2 = (DF.loc[(DF["country"] == "Russian Federation") & (DF["age"] == "25-34 years")
& (DF["sex"] == "female") & (DF["year"] >= 2000)])
year_sex_suicides = {}
year_sex_suicides["year"] = DF1["year"]
year_sex_suicides["male_suicides"] = DF1["suicides_no"]
year_sex_suicides["female_suicides"] = DF2["suicides_no"]
DF333 = pd.DataFrame(data=year_sex_suicides)
下面是我创建新数据框的代码
DF = pd.read_csv("D:/who_suicide_statistics.csv")
DF1 = (DF.loc[(DF["country"] == "Russian Federation") & (DF["age"] == "25-34 years")
& (DF["sex"] == "male") & (DF["year"] >= 2000)])
DF2 = (DF.loc[(DF["country"] == "Russian Federation") & (DF["age"] == "25-34 years")
& (DF["sex"] == "female") & (DF["year"] >= 2000)])
year_sex_suicides = {}
year_sex_suicides["year"] = DF1["year"]
year_sex_suicides["male_suicides"] = DF1["suicides_no"]
year_sex_suicides["female_suicides"] = DF2["suicides_no"]
DF333 = pd.DataFrame(data=year_sex_suicides)
这是我想要的情节代码
DF333.plot(kind="line", x="year", y=["male suicides", "female_suicides"])
我得出的图表是这样的
有点问题,但我找不到。您试图绘制的数据集中可能有很多
NaN
s(例如,通过计算print(DF333)
查看数据帧)
您可以使用以下方法填充它们(虽然这不是一个好方法!):
或在构建数据帧时重置索引:
DF1 = (DF.loc[(DF["country"] == "Russian Federation") & (DF["age"] == "25-34 years")
& (DF["sex"] == "male") & (DF["year"] >= 2000)])
DF1 = DF1.set_index('year')
DF2 = (DF.loc[(DF["country"] == "Russian Federation") & (DF["age"] == "25-34 years")
& (DF["sex"] == "female") & (DF["year"] >= 2000)])
DF2 = DF2.set_index('year')
year_sex_suicides = {}
year_sex_suicides["male_suicides"] = DF1["suicides_no"]
year_sex_suicides["female_suicides"] = DF2["suicides_no"]
DF333 = pd.DataFrame(data=year_sex_suicides)
DF333.plot(kind="line", y=["male_suicides", "female_suicides"])
这样,您可以确保所有内容都放在与年份匹配的行中,而不是原始CSV文件中的行索引。当然,您也可以使用类似Panda的东西,这也将减少代码行数(但以后可能还需要DF1
等用于其他目的):
您可能在试图绘制的数据集中有相当多的
NaN
s(例如,通过计算print(DF333)
查看数据帧)
您可以使用以下方法填充它们(虽然这不是一个好方法!):
或在构建数据帧时重置索引:
DF1 = (DF.loc[(DF["country"] == "Russian Federation") & (DF["age"] == "25-34 years")
& (DF["sex"] == "male") & (DF["year"] >= 2000)])
DF1 = DF1.set_index('year')
DF2 = (DF.loc[(DF["country"] == "Russian Federation") & (DF["age"] == "25-34 years")
& (DF["sex"] == "female") & (DF["year"] >= 2000)])
DF2 = DF2.set_index('year')
year_sex_suicides = {}
year_sex_suicides["male_suicides"] = DF1["suicides_no"]
year_sex_suicides["female_suicides"] = DF2["suicides_no"]
DF333 = pd.DataFrame(data=year_sex_suicides)
DF333.plot(kind="line", y=["male_suicides", "female_suicides"])
这样,您可以确保所有内容都放在与年份匹配的行中,而不是原始CSV文件中的行索引。当然,您也可以使用类似Panda的东西,这也将减少代码行数(但以后可能还需要DF1
等用于其他目的):