Machine learning 结合词向量和标量特征进行分类_Machine Learning_Tensorflow_Word2vec_Text Classification_Feature Selection

Machine learning 结合词向量和标量特征进行分类

machine-learning tensorflow

Machine learning 结合词向量和标量特征进行分类,machine-learning,tensorflow,word2vec,text-classification,feature-selection,Machine Learning,Tensorflow,Word2vec,Text Classification,Feature Selection,我正在研究一个短句分类问题，从中我得到了以下信息输入人的年龄（1-100岁）个人性别（男性或女性）句子内容输出标签（内容类型）为了模拟句子，我使用word2vec和tfidf组合。我还想添加年龄和性别作为特征，以及嵌入到分类器中的句子。正确的方法是什么？因为嵌入是一个n维数组，年龄、性别都是标量。我对如何添加它们和可视化数据感到困惑单词嵌入，作为n维向量，只是n个标量例如，如果你有300维的向量来自单词向量，然后是年龄标量（1-100），然后是性别标量（可能是0或1），那么你的

我正在研究一个短句分类问题，从中我得到了以下信息

输入人的年龄（1-100岁）个人性别（男性或女性）句子内容

输出标签（内容类型）

为了模拟句子，我使用word2vec和tfidf组合。我还想添加年龄和性别作为特征，以及嵌入到分类器中的句子。正确的方法是什么？因为嵌入是一个n维数组，年龄、性别都是标量。我对如何添加它们和可视化数据感到困惑

单词嵌入，作为n维向量，只是n个标量

例如，如果你有300维的向量来自单词向量，然后是年龄标量（1-100），然后是性别标量（可能是0或1），那么你的分类器有302维的数据

有关将这些不同的功能连接在一起的示例，请参见。（如果对这些不同的特征进行缩放，使其具有更相似的范围/分布，则某些分类器的性能可能会更好。）

找到解决方案了吗？我正在处理一个类似的问题。