Pandas 箱线图错误:目前不支持1 ndim分类
我有两个numpy数组,如下所示Pandas 箱线图错误:目前不支持1 ndim分类,pandas,numpy,machine-learning,scikit-learn,seaborn,Pandas,Numpy,Machine Learning,Scikit Learn,Seaborn,我有两个numpy数组,如下所示 clf_scores = numpy.array( [[ 0.66333666, 0.65634366, 0.63836164, 0.64435564, 0.658 , 0.641 , 0.67167167, 0.66066066, 0.67167167, 0.65165165], [ 0.6983017 , 0.70629371, 0.70529471, 0.68331668,
clf_scores = numpy.array(
[[ 0.66333666, 0.65634366, 0.63836164, 0.64435564, 0.658 ,
0.641 , 0.67167167, 0.66066066, 0.67167167, 0.65165165],
[ 0.6983017 , 0.70629371, 0.70529471, 0.68331668, 0.702 ,
0.688 , 0.71371371, 0.69269269, 0.70770771, 0.6996997 ],
[ 0.65934066, 0.68531469, 0.65834166, 0.66333666, 0.677 ,
0.668 , 0.68568569, 0.68668669, 0.6996997 , 0.68168168],
.... .... .... .... ....
[ 0.68731269, 0.71928072, 0.7002997 , 0.70929071, 0.723 ,
0.697 , 0.68968969, 0.71271271, 0.72672673, 0.6996997 ],
[ 0.68731269, 0.72027972, 0.6973027 , 0.70729271, 0.726 ,
0.695 , 0.68568569, 0.71271271, 0.72572573, 0.6996997 ],
[ 0.69030969, 0.71728272, 0.6983017 , 0.70929071, 0.725 ,
0.698 , 0.68668669, 0.71371371, 0.72572573, 0.6996997 ]])
sns.boxplot(clf_scores,Trees)
及
这些阵列具有形状
(100,10)和
(100,)
如何使用seaborn.boxplot绘制这两个阵列?
我试图将这两个numpy数组框绘如下
clf_scores = numpy.array(
[[ 0.66333666, 0.65634366, 0.63836164, 0.64435564, 0.658 ,
0.641 , 0.67167167, 0.66066066, 0.67167167, 0.65165165],
[ 0.6983017 , 0.70629371, 0.70529471, 0.68331668, 0.702 ,
0.688 , 0.71371371, 0.69269269, 0.70770771, 0.6996997 ],
[ 0.65934066, 0.68531469, 0.65834166, 0.66333666, 0.677 ,
0.668 , 0.68568569, 0.68668669, 0.6996997 , 0.68168168],
.... .... .... .... ....
[ 0.68731269, 0.71928072, 0.7002997 , 0.70929071, 0.723 ,
0.697 , 0.68968969, 0.71271271, 0.72672673, 0.6996997 ],
[ 0.68731269, 0.72027972, 0.6973027 , 0.70729271, 0.726 ,
0.695 , 0.68568569, 0.71271271, 0.72572573, 0.6996997 ],
[ 0.69030969, 0.71728272, 0.6983017 , 0.70929071, 0.725 ,
0.698 , 0.68668669, 0.71371371, 0.72572573, 0.6996997 ]])
sns.boxplot(clf_scores,Trees)
然而,我得到以下错误
NotImplementedError: > 1 ndim Categorical are not supported at this time
请告诉我如何更正它以获得适当的箱线图
PS:数据集是通过查找随机森林分类器的交叉值得分获得的,其中nTrees=100
正确的输出如下所示对我来说,最简单的方法是先将数据转换为pandas数据帧,然后使用seaborn进行绘图:
clf_scores = numpy.array(
[[ 0.66333666, 0.65634366, 0.63836164, 0.64435564, 0.658 ,
0.641 , 0.67167167, 0.66066066, 0.67167167, 0.65165165],
[ 0.6983017 , 0.70629371, 0.70529471, 0.68331668, 0.702 ,
0.688 , 0.71371371, 0.69269269, 0.70770771, 0.6996997 ],
[ 0.65934066, 0.68531469, 0.65834166, 0.66333666, 0.677 ,
0.668 , 0.68568569, 0.68668669, 0.6996997 , 0.68168168],
.... .... .... .... ....
[ 0.68731269, 0.71928072, 0.7002997 , 0.70929071, 0.723 ,
0.697 , 0.68968969, 0.71271271, 0.72672673, 0.6996997 ],
[ 0.68731269, 0.72027972, 0.6973027 , 0.70729271, 0.726 ,
0.695 , 0.68568569, 0.71271271, 0.72572573, 0.6996997 ],
[ 0.69030969, 0.71728272, 0.6983017 , 0.70929071, 0.725 ,
0.698 , 0.68668669, 0.71371371, 0.72572573, 0.6996997 ]])
sns.boxplot(clf_scores,Trees)
import numpy as np
import pandas as pd
import seaborn as sns
df = pd.DataFrame(np.transpose(clf_scores))
sns.boxplot(data=df)
数据帧df
对应于中所述的“宽格式数据帧”。在您的方法中,seaborn将数据的格式弄错了,并假设它是分类的,但事实并非如此。对我来说,最简单的方法是先将数据转换为pandas数据帧,然后使用seaborn:
import numpy as np
import pandas as pd
import seaborn as sns
df = pd.DataFrame(np.transpose(clf_scores))
sns.boxplot(data=df)
数据帧df
对应于中所述的“宽格式数据帧”。在您的方法中,seaborn将数据的格式弄错了,并假设它是一个分类的,但事实并非如此。这两个数组中的哪一个是clf分数
?我想你应该修改一下这个问题,使它更清楚。@correct!这两个数组中的哪一个是clf分数
?我想你应该修改一下这个问题,使它更清楚。@correct!我认为sns.boxplot
也可以处理原始(但转置)数组。@Paul,我也这么认为,但无法立即使其工作。纯粹的转置似乎不起作用。作为免责声明,我很少使用seaborn绘制原始numpy数组。我认为sns.boxplot
也可以处理原始(但转置)数组。@Paul,我也这么认为,但无法立即使其工作。纯粹的转置似乎不起作用。作为免责声明,我很少使用seaborn绘制原始numpy阵列。