Python ValueError:找到样本数不一致的数组:[3 21]
在这个问题上已经有多个线程,但是提议的解决方案似乎都不适合我 这是我的密码:Python ValueError:找到样本数不一致的数组:[3 21],python,Python,在这个问题上已经有多个线程,但是提议的解决方案似乎都不适合我 这是我的密码: count_vect = CountVectorizer() X_train_counts = count_vect.fit_transform(s) tf_transformer = TfidfTransformer(use_idf=False).fit(X_train_counts) X_train_tf = tf_transformer.transform(X_train_counts) t
count_vect = CountVectorizer()
X_train_counts = count_vect.fit_transform(s)
tf_transformer = TfidfTransformer(use_idf=False).fit(X_train_counts)
X_train_tf = tf_transformer.transform(X_train_counts)
tfidf_transformer = TfidfTransformer()
X_train_tfidf = tfidf_transformer.fit_transform(X_train_counts)
clf = MultinomialNB().fit(X_train_tfidf, target_train)
运行此代码时,出现以下错误:
回溯(最近一次调用last):文件“distance_sup1.py”,第行
447,在
clf=MultinomialNB().fit(X\u train\u tfidf,target\u train)文件“C:\Users\Akanksha\Anaconda3\lib\site packages\sklearn\naive\u bayes.py”,
第527行,合适的
十、 y=检查_X_y(X,y,'csr')文件“C:\Users\Akanksha\Anaconda3\lib\site packages\sklearn\utils\validation.py”,
第520行,在check_X_y check_一致长度(X,y)文件中
“C:\Users\Akanksha\Anaconda3\lib\site packages\sklearn\utils\validation.py”,
第176行,检查长度是否一致
%s“%str(uniques))ValueError:找到样本数不一致的数组:[3 21]
我的目标是:[1,1,0]X\u列车的tfidf为:
(0, 5)---1.0
(2, 2)---0.670546709445
(2, 17)---0.741867313239
(3, 12)---0.707106781187
(3, 13)---0.707106781187
(4, 9)---0.741867313239
(4, 2)---0.670546709445
(5, 8)---0.707106781187
(5, 0)---0.707106781187
(6, 10)---1.0
(7, 7)---0.457600845725
(7, 3)---0.457600845725
(7, 16)---0.457600845725
(7, 1)---0.457600845725
(7, 5)---0.40299610912
(9, 6)---0.351227138886
(9, 4)---0.398817338825
(9, 9)---0.702454277773
(9, 2)---0.317461354673
(9, 17)---0.351227138886
(10, 15)---0.707106781187
(10, 14)---0.707106781187
(11, 11)---0.750463470011
(11, 6)---0.660911930729
我尝试过改造它,改造X_train_tfidf,但似乎不起作用
感谢您的帮助