Warning: file_get_contents(/data/phpspider/zhask/data//catemap/6/opengl/4.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python Boxplot需要在Pandas中使用多个groupby_Python_Pandas_Boxplot_Jupyter - Fatal编程技术网

Python Boxplot需要在Pandas中使用多个groupby

Python Boxplot需要在Pandas中使用多个groupby,python,pandas,boxplot,jupyter,Python,Pandas,Boxplot,Jupyter,我正在使用熊猫、Jupyter笔记本和python。 我有以下数据集作为数据帧 Cars,Country,Type 1564,Australia,Stolen 200,Australia,Stolen 579,Australia,Stolen 156,Japan,Lost 900,Africa,Burnt 2000,USA,Stolen 1000,Indonesia,Stolen 900,Australia,Lost 798,Australia,Lost 128,Australia,Lost 2

我正在使用熊猫、Jupyter笔记本和python。 我有以下数据集作为数据帧

Cars,Country,Type
1564,Australia,Stolen
200,Australia,Stolen
579,Australia,Stolen
156,Japan,Lost
900,Africa,Burnt
2000,USA,Stolen
1000,Indonesia,Stolen
900,Australia,Lost
798,Australia,Lost
128,Australia,Lost
200,Australia,Burnt
56,Australia,Burnt
348,Australia,Burnt
1246,USA,Burnt
我想知道如何使用方框图回答以下问题“澳大利亚受每种类型影响的汽车数量”。所以基本上,我应该有3个箱线图(每种类型)显示澳大利亚受影响的汽车数量


请记住,这是真实数据集的子集。

您只能从
“国家”
列中选择与
“澳大利亚”
对应的行,并按
“类型”
列对其进行分组,如图所示:

from StringIO import StringIO
import pandas as pd

text_string = StringIO(
"""
Cars,Country,Type,Score
1564,Australia,Stolen,1
200,Australia,Stolen,2
579,Australia,Stolen,3
156,Japan,Lost,4
900,Africa,Burnt,5
2000,USA,Stolen,6
1000,Indonesia,Stolen,7
900,Australia,Lost,8
798,Australia,Lost,9
128,Australia,Lost,10
200,Australia,Burnt,11
56,Australia,Burnt,12
348,Australia,Burnt,13
1246,USA,Burnt,14
""")

df = pd.read_csv(text_string, sep = ",")
# Specifically checks in column name "Cars"
group = df.loc[df['Country'] == 'Australia'].boxplot(column = 'Cars', by = 'Type')

您只能从
“国家”
列中选择与
“澳大利亚”
相对应的行,并按
“类型”
列对其进行分组,如图所示:

from StringIO import StringIO
import pandas as pd

text_string = StringIO(
"""
Cars,Country,Type,Score
1564,Australia,Stolen,1
200,Australia,Stolen,2
579,Australia,Stolen,3
156,Japan,Lost,4
900,Africa,Burnt,5
2000,USA,Stolen,6
1000,Indonesia,Stolen,7
900,Australia,Lost,8
798,Australia,Lost,9
128,Australia,Lost,10
200,Australia,Burnt,11
56,Australia,Burnt,12
348,Australia,Burnt,13
1246,USA,Burnt,14
""")

df = pd.read_csv(text_string, sep = ",")
# Specifically checks in column name "Cars"
group = df.loc[df['Country'] == 'Australia'].boxplot(column = 'Cars', by = 'Type')

如果数据集中有另一列包含数字,您如何确保Y轴保持不变或聚焦于汽车?所以数据框是:分数,汽车,国家,类型,其中分数也是数字,很像Car@Timetraveller:请查看编辑后的答案,该答案专门针对Cars栏。非常感谢。这正是我所做的。如果数据集中有另一列包含数字,您如何确保Y轴保持不变或集中在汽车上?所以数据框是:分数,汽车,国家,类型,其中分数也是数字,很像Car@Timetraveller:请查看编辑后的答案,该答案专门针对Cars栏。非常感谢。我就是这么做的。