Machine learning 预测具有分类、数字和文本的数据

Machine learning 预测具有分类、数字和文本的数据,machine-learning,Machine Learning,我正在尝试为我的数据集构建一个分类器。数据中的每个观察值都有分类和数值,以及自由文本中更一般的描述。我知道如何构建一个boosting算法来处理分类值和数值,并且我已经训练了一个神经网络,该网络在文本中进行了非常成功的预测。我要考虑的是如何将这两种方法结合起来?使用语言模型嵌入自由文本,例如平均快速文本嵌入,或使用谷歌通用句子编码器嵌入N维浮点向量。一个热编码分类的东西。将[embedding,one_hot_encoding,numericals]和badabing-badaboom连接起来,

我正在尝试为我的数据集构建一个分类器。数据中的每个观察值都有分类和数值,以及自由文本中更一般的描述。我知道如何构建一个boosting算法来处理分类值和数值,并且我已经训练了一个神经网络,该网络在文本中进行了非常成功的预测。我要考虑的是如何将这两种方法结合起来?

使用语言模型嵌入自由文本,例如平均快速文本嵌入,或使用谷歌通用句子编码器嵌入N维浮点向量。一个热编码分类的东西。将[embedding,one_hot_encoding,numericals]和badabing-badaboom连接起来,您得到了一个表示数据点的向量

Tensorflow hub的KerasLayer+def是一个很好的起点。我想你需要自己训练一些东西,你可以研究tf.keras.layers.Embedding