随机林分类器Python:ValueError:使用序列设置数组元素

随机林分类器Python:ValueError:使用序列设置数组元素,python,scikit-learn,random-forest,valueerror,Python,Scikit Learn,Random Forest,Valueerror,我已多次使用随机林,但从未遇到此错误: ValueError:使用序列设置数组元素 我的train_x数据帧采用以下格式: 如何更改格式,以便运行分类器 我认为问题在于tfidf和lda是作为矩阵给出的,但我已经将这些值转换为列表,这没有帮助 from sklearn.ensemble import RandomForestClassifier clf2 = RandomForestClassifier(random_state=1) clf2.fit(train_x, train_y) 完

我已多次使用随机林,但从未遇到此错误: ValueError:使用序列设置数组元素

我的train_x数据帧采用以下格式:

如何更改格式,以便运行分类器

我认为问题在于tfidf和lda是作为矩阵给出的,但我已经将这些值转换为列表,这没有帮助

from sklearn.ensemble import RandomForestClassifier
clf2 = RandomForestClassifier(random_state=1)
clf2.fit(train_x, train_y)
完整错误如下:


ValueError回溯(最近一次调用)
在()
---->1 clf2.装配(x列、y列)
~\AppData\Local\Continuum\anaconda3\lib\site packages\sklearn\employee\forest.py适合(自身、X、y、样本重量)
245         """
246#验证或转换输入数据
-->247 X=检查数组(X,接受sparse=“csc”,dtype=dtype)
248 y=检查数组(y,接受sparse='csc',确保2d=False,dtype=None)
249如果样品重量不是无:
检查数组中的~\AppData\Local\Continuum\anaconda3\lib\site packages\sklearn\utils\validation.py(数组、接受稀疏、数据类型、顺序、复制、强制所有有限、确保2d、允许nd、确保最小样本、确保最小特征、警告数据类型、估计器)
431力(所有有限)
432其他:
-->433 array=np.array(array,dtype=dtype,order=order,copy=copy)
434
435如果确保_2d:
ValueError:使用序列设置数组元素。

Scikit不会像您在
X\u train
中所做的那样处理列中的二维数组。您需要通过组合行来创建一个简单的二维数组。嗨,Vivek,我不确定您的意思。您是说我应该从现有二维数组中创建一个不同的二维数组?这些二维数组到底有什么不同?
ValueError                                Traceback (most recent call last)
<ipython-input-111-7ae6360c296b> in <module>()
----> 1 clf2.fit(train_x, train_y)

~\AppData\Local\Continuum\anaconda3\lib\site-packages\sklearn\ensemble\forest.py in fit(self, X, y, sample_weight)
    245         """
    246         # Validate or convert input data
--> 247         X = check_array(X, accept_sparse="csc", dtype=DTYPE)
    248         y = check_array(y, accept_sparse='csc', ensure_2d=False, dtype=None)
    249         if sample_weight is not None:

~\AppData\Local\Continuum\anaconda3\lib\site-packages\sklearn\utils\validation.py in check_array(array, accept_sparse, dtype, order, copy, force_all_finite, ensure_2d, allow_nd, ensure_min_samples, ensure_min_features, warn_on_dtype, estimator)
    431                                       force_all_finite)
    432     else:
--> 433         array = np.array(array, dtype=dtype, order=order, copy=copy)
    434 
    435         if ensure_2d:

ValueError: setting an array element with a sequence.