Machine learning 什么样的神经网络结构适合预测文章的受欢迎程度?

Machine learning 什么样的神经网络结构适合预测文章的受欢迎程度?,machine-learning,neural-network,Machine Learning,Neural Network,我是机器学习和神经网络的新手。目前我正在coursera.org上学习神经网络的课程,但我并不完全理解。我的论文有点问题。我应该使用神经网络,但我不知道如何为我的问题选择正确的神经网络结构 我有很多来自门户网站的数据(通常是报纸、杂志的在线版本)。有关于文章的信息,例如,文章名称、文章文本和文章发布。还有大量的序列数据可以捕获用户的行为 我的目标是预测一篇文章的受欢迎程度(读者数量或唯一用户对文章的点击次数)。我想从这些数据中生成向量,并将这些向量输入我的神经网络 我有两个问题: 1。如何创建正

我是机器学习和神经网络的新手。目前我正在coursera.org上学习神经网络的课程,但我并不完全理解。我的论文有点问题。我应该使用神经网络,但我不知道如何为我的问题选择正确的神经网络结构

我有很多来自门户网站的数据(通常是报纸、杂志的在线版本)。有关于文章的信息,例如,文章名称、文章文本和文章发布。还有大量的序列数据可以捕获用户的行为

我的目标是预测一篇文章的受欢迎程度(读者数量或唯一用户对文章的点击次数)。我想从这些数据中生成向量,并将这些向量输入我的神经网络

我有两个问题:

1。如何创建正确的向量?


2。哪个神经网络结构最适合这个问题?

这些都是非常广泛的问题。如果你想得到更准确的答案,你需要找出更小的问题

如何创建右向量

对于文本数据,通常使用。最好的结果往往是通过使用

哪种神经网络结构适用于这个问题

这很难说。我将从一个具有
k
输入神经元的网络开始(其中
k
是应用tf-idf后向量的大小:您可能还希望进行某种特征选择以减少特征的数量。一种好的特征选择方法是通过。)

然后,通过使用单个隐层,使神经元数量等于输入神经元和输出神经元数量之间的平均值,给出了一个标准的网络布局。然后,看起来您只需要一个输出神经元,它将输出文章的流行程度(这可以是一个或一个神经元)

对于隐藏层中的神经元,您也可以使用


你还可以尝试很多其他东西:重量衰减、动量技术、多层网络、循环网络等等。如果没有大量的实验,就不可能说什么对你给定的问题最有效。

有一些问题点:关于
向量的问题没有意义。这里没有对与错,只有
预测性
不太预测性
。提取好的(=预测性)特征是机器学习的本质,在很大程度上取决于您的问题。如果这个问题有一个通用的答案,那么机器学习将是一项微不足道的任务,不是吗?你的策略应该是:尝试你认为可以预测的功能(例如文章中的字数),看看它的效果如何。。。网络真的不太重要,只要它不太简单