Scikit learn 基于scikit的支持向量机文本挖掘

Scikit learn 基于scikit的支持向量机文本挖掘,scikit-learn,svm,text-mining,Scikit Learn,Svm,Text Mining,有人可以分享一段代码片段,演示如何使用scikit使用SVM进行文本挖掘。我看过一个关于数值数据的SVM示例,但不太确定如何处理文本。我看着 但是找不到支持向量机。在文本挖掘问题中,文本由数值表示。每个特征代表一个单词,值是二进制数。这就给出了一个包含大量零和少量1的矩阵,这意味着文本中存在相应的单词。可以根据单词的频率或其他标准赋予单词一定的权重。然后得到一些实数,而不是0和1 将数据集转换为数值后,可以使用以下示例:

有人可以分享一段代码片段,演示如何使用scikit使用SVM进行文本挖掘。我看过一个关于数值数据的SVM示例,但不太确定如何处理文本。我看着
但是找不到支持向量机。

在文本挖掘问题中,文本由数值表示。每个特征代表一个单词,值是二进制数。这就给出了一个包含大量零和少量1的矩阵,这意味着文本中存在相应的单词。可以根据单词的频率或其他标准赋予单词一定的权重。然后得到一些实数,而不是0和1

将数据集转换为数值后,可以使用以下示例: