Pandas 箱线图错误:目前不支持1 ndim分类

Pandas 箱线图错误:目前不支持1 ndim分类,pandas,numpy,machine-learning,scikit-learn,seaborn,Pandas,Numpy,Machine Learning,Scikit Learn,Seaborn,我有两个numpy数组,如下所示 clf_scores = numpy.array( [[ 0.66333666, 0.65634366, 0.63836164, 0.64435564, 0.658 , 0.641 , 0.67167167, 0.66066066, 0.67167167, 0.65165165], [ 0.6983017 , 0.70629371, 0.70529471, 0.68331668,

我有两个numpy数组,如下所示

clf_scores = numpy.array(
      [[ 0.66333666,  0.65634366,  0.63836164,  0.64435564,  0.658     ,
         0.641     ,  0.67167167,  0.66066066,  0.67167167,  0.65165165],
       [ 0.6983017 ,  0.70629371,  0.70529471,  0.68331668,  0.702     ,
         0.688     ,  0.71371371,  0.69269269,  0.70770771,  0.6996997 ],
       [ 0.65934066,  0.68531469,  0.65834166,  0.66333666,  0.677     ,
         0.668     ,  0.68568569,  0.68668669,  0.6996997 ,  0.68168168],
         ....         ....         ....         ....         ....
       [ 0.68731269,  0.71928072,  0.7002997 ,  0.70929071,  0.723     ,
         0.697     ,  0.68968969,  0.71271271,  0.72672673,  0.6996997 ],
       [ 0.68731269,  0.72027972,  0.6973027 ,  0.70729271,  0.726     ,
         0.695     ,  0.68568569,  0.71271271,  0.72572573,  0.6996997 ],
       [ 0.69030969,  0.71728272,  0.6983017 ,  0.70929071,  0.725     ,
         0.698     ,  0.68668669,  0.71371371,  0.72572573,  0.6996997 ]])
sns.boxplot(clf_scores,Trees)

这些阵列具有形状 (100,10)和 (100,)

如何使用seaborn.boxplot绘制这两个阵列?

我试图将这两个numpy数组框绘如下

clf_scores = numpy.array(
      [[ 0.66333666,  0.65634366,  0.63836164,  0.64435564,  0.658     ,
         0.641     ,  0.67167167,  0.66066066,  0.67167167,  0.65165165],
       [ 0.6983017 ,  0.70629371,  0.70529471,  0.68331668,  0.702     ,
         0.688     ,  0.71371371,  0.69269269,  0.70770771,  0.6996997 ],
       [ 0.65934066,  0.68531469,  0.65834166,  0.66333666,  0.677     ,
         0.668     ,  0.68568569,  0.68668669,  0.6996997 ,  0.68168168],
         ....         ....         ....         ....         ....
       [ 0.68731269,  0.71928072,  0.7002997 ,  0.70929071,  0.723     ,
         0.697     ,  0.68968969,  0.71271271,  0.72672673,  0.6996997 ],
       [ 0.68731269,  0.72027972,  0.6973027 ,  0.70729271,  0.726     ,
         0.695     ,  0.68568569,  0.71271271,  0.72572573,  0.6996997 ],
       [ 0.69030969,  0.71728272,  0.6983017 ,  0.70929071,  0.725     ,
         0.698     ,  0.68668669,  0.71371371,  0.72572573,  0.6996997 ]])
sns.boxplot(clf_scores,Trees)
然而,我得到以下错误

NotImplementedError: > 1 ndim Categorical are not supported at this time
请告诉我如何更正它以获得适当的箱线图

PS:数据集是通过查找
随机森林分类器的
交叉值得分
获得的,其中
nTrees=100


正确的输出如下所示

对我来说,最简单的方法是先将数据转换为pandas数据帧,然后使用seaborn进行绘图:

clf_scores = numpy.array(
      [[ 0.66333666,  0.65634366,  0.63836164,  0.64435564,  0.658     ,
         0.641     ,  0.67167167,  0.66066066,  0.67167167,  0.65165165],
       [ 0.6983017 ,  0.70629371,  0.70529471,  0.68331668,  0.702     ,
         0.688     ,  0.71371371,  0.69269269,  0.70770771,  0.6996997 ],
       [ 0.65934066,  0.68531469,  0.65834166,  0.66333666,  0.677     ,
         0.668     ,  0.68568569,  0.68668669,  0.6996997 ,  0.68168168],
         ....         ....         ....         ....         ....
       [ 0.68731269,  0.71928072,  0.7002997 ,  0.70929071,  0.723     ,
         0.697     ,  0.68968969,  0.71271271,  0.72672673,  0.6996997 ],
       [ 0.68731269,  0.72027972,  0.6973027 ,  0.70729271,  0.726     ,
         0.695     ,  0.68568569,  0.71271271,  0.72572573,  0.6996997 ],
       [ 0.69030969,  0.71728272,  0.6983017 ,  0.70929071,  0.725     ,
         0.698     ,  0.68668669,  0.71371371,  0.72572573,  0.6996997 ]])
sns.boxplot(clf_scores,Trees)
 import numpy as np
 import pandas as pd
 import seaborn as sns

 df = pd.DataFrame(np.transpose(clf_scores))
 sns.boxplot(data=df)

数据帧
df
对应于中所述的“宽格式数据帧”。在您的方法中,seaborn将数据的格式弄错了,并假设它是分类的,但事实并非如此。

对我来说,最简单的方法是先将数据转换为pandas数据帧,然后使用seaborn:

 import numpy as np
 import pandas as pd
 import seaborn as sns

 df = pd.DataFrame(np.transpose(clf_scores))
 sns.boxplot(data=df)

数据帧
df
对应于中所述的“宽格式数据帧”。在您的方法中,seaborn将数据的格式弄错了,并假设它是一个分类的,但事实并非如此。

这两个数组中的哪一个是
clf分数
?我想你应该修改一下这个问题,使它更清楚。@correct!这两个数组中的哪一个是
clf分数
?我想你应该修改一下这个问题,使它更清楚。@correct!我认为
sns.boxplot
也可以处理原始(但转置)数组。@Paul,我也这么认为,但无法立即使其工作。纯粹的转置似乎不起作用。作为免责声明,我很少使用seaborn绘制原始numpy数组。我认为
sns.boxplot
也可以处理原始(但转置)数组。@Paul,我也这么认为,但无法立即使其工作。纯粹的转置似乎不起作用。作为免责声明,我很少使用seaborn绘制原始numpy阵列。