Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/tensorflow/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Machine learning 结合词向量和标量特征进行分类_Machine Learning_Tensorflow_Word2vec_Text Classification_Feature Selection - Fatal编程技术网

Machine learning 结合词向量和标量特征进行分类

Machine learning 结合词向量和标量特征进行分类,machine-learning,tensorflow,word2vec,text-classification,feature-selection,Machine Learning,Tensorflow,Word2vec,Text Classification,Feature Selection,我正在研究一个短句分类问题,从中我得到了以下信息 输入 人的年龄(1-100岁) 个人性别(男性或女性) 句子内容 输出 标签(内容类型) 为了模拟句子,我使用word2vec和tfidf组合。我还想添加年龄和性别作为特征,以及嵌入到分类器中的句子。正确的方法是什么?因为嵌入是一个n维数组,年龄、性别都是标量。我对如何添加它们和可视化数据感到困惑 单词嵌入,作为n维向量,只是n个标量 例如,如果你有300维的向量来自单词向量,然后是年龄标量(1-100),然后是性别标量(可能是0或1),那么你的

我正在研究一个短句分类问题,从中我得到了以下信息

输入 人的年龄(1-100岁) 个人性别(男性或女性) 句子内容

输出 标签(内容类型)


为了模拟句子,我使用word2vec和tfidf组合。我还想添加年龄和性别作为特征,以及嵌入到分类器中的句子。正确的方法是什么?因为嵌入是一个n维数组,年龄、性别都是标量。我对如何添加它们和可视化数据感到困惑

单词嵌入,作为n维向量,只是n个标量

例如,如果你有300维的向量来自单词向量,然后是年龄标量(1-100),然后是性别标量(可能是0或1),那么你的分类器有302维的数据


有关将这些不同的功能连接在一起的示例,请参见。(如果对这些不同的特征进行缩放,使其具有更相似的范围/分布,则某些分类器的性能可能会更好。)

找到解决方案了吗?我正在处理一个类似的问题。