Python sk学习除文本外的其他输入,以便进行文本分类

Python sk学习除文本外的其他输入,以便进行文本分类,python,scikit-learn,classification,words,text-classification,Python,Scikit Learn,Classification,Words,Text Classification,我试图做一个文本分类器使用“Sci工具包”学习袋的话。矢量化到分类器中。但是,我想知道除了文本本身之外,如何向输入中添加另一个变量。假设我想在文本之外添加一些单词(因为我认为这可能会影响结果)。我该怎么做呢? 我必须在这个分类器上再添加一个分类器吗?或者有没有办法将输入添加到矢量化文本中 Scikit学习分类器适用于numpy数组。 这意味着在对文本进行矢量化之后,您可以轻松地将新功能添加到此数组中(我收回这句话,虽然不太容易,但可行)。 问题是在文本分类中,您的功能将是稀疏的,所以正常的num

我试图做一个文本分类器使用“Sci工具包”学习袋的话。矢量化到分类器中。但是,我想知道除了文本本身之外,如何向输入中添加另一个变量。假设我想在文本之外添加一些单词(因为我认为这可能会影响结果)。我该怎么做呢?

我必须在这个分类器上再添加一个分类器吗?或者有没有办法将输入添加到矢量化文本中

Scikit学习分类器适用于numpy数组。 这意味着在对文本进行矢量化之后,您可以轻松地将新功能添加到此数组中(我收回这句话,虽然不太容易,但可行)。 问题是在文本分类中,您的功能将是稀疏的,所以正常的numpy列添加不起作用

代码修改自

结果如下:

<class 'scipy.sparse.csr.csr_matrix'>
X_train_only_text_features (2034, 17566)
size 2034
ones_column (2034L, 1L)
<class 'scipy.sparse.csr.csr_matrix'>
new_column (2034, 1)
X_train (2034, 17567)

X_仅列车_文本_功能(203417566)
2034号
一列(2034L,1L)
新_栏(2034,1)
X_列车(203417567)

哦,我明白了。非常感谢您,先生。我正在研究一个类似的问题&使用。
<class 'scipy.sparse.csr.csr_matrix'>
X_train_only_text_features (2034, 17566)
size 2034
ones_column (2034L, 1L)
<class 'scipy.sparse.csr.csr_matrix'>
new_column (2034, 1)
X_train (2034, 17567)