Machine learning 如何在机器学习的训练集中结合文本和数字特征?

Machine learning 如何在机器学习的训练集中结合文本和数字特征?,machine-learning,scikit-learn,ipython,svm,feature-selection,Machine Learning,Scikit Learn,Ipython,Svm,Feature Selection,我试图根据数字特征和文本特征预测社交网络中帖子的喜欢度。现在我有了具有必需功能的dataframe,但我不知道如何处理posts文本数据。为了得到合适的列车矩阵,我是否应该对其进行矢量化/执行smth其他操作?我将使用sklearn的LinearSVC进行分析 有很多不同的方法可以将文本功能转换为数字功能 最常见的方法之一是“纸袋法”。将文本转换为每个单词出现的数组 如果您正在使用scikit学习,我建议您阅读他们的 此外,还可以查看更多复杂的文本数据处理方法。您计划使用哪种macnine学习方

我试图根据数字特征和文本特征预测社交网络中帖子的喜欢度。现在我有了具有必需功能的dataframe,但我不知道如何处理posts文本数据。为了得到合适的列车矩阵,我是否应该对其进行矢量化/执行smth其他操作?我将使用sklearn的LinearSVC进行分析


有很多不同的方法可以将文本功能转换为数字功能

最常见的方法之一是“纸袋法”。将文本转换为每个单词出现的数组

如果您正在使用scikit学习,我建议您阅读他们的


此外,还可以查看更多复杂的文本数据处理方法。

您计划使用哪种macnine学习方法?支持向量机可能是一个不错的选择,因为你正在处理文本特征。对不起,我没有提到,是的,我将使用支持向量机。线性SVC。谢谢你的回答。我明白,我需要一个词的错误。我已经将帖子的文本数据划分成单词并进行了预处理。我不知道下一步该做什么,如何将其加入到一个矩阵中,以便将来进行SVM分析。我明白了你的想法,并在我的代码中发现了一些愚蠢的错误。谢谢你的回答:)