Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/meteor/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Neural network 如何在短对排序中使用学习对模型(CNN、LSTM)进行排序?_Neural Network_Nlp_Conv Neural Network_Information Retrieval_Recurrent Neural Network - Fatal编程技术网

Neural network 如何在短对排序中使用学习对模型(CNN、LSTM)进行排序?

Neural network 如何在短对排序中使用学习对模型(CNN、LSTM)进行排序?,neural-network,nlp,conv-neural-network,information-retrieval,recurrent-neural-network,Neural Network,Nlp,Conv Neural Network,Information Retrieval,Recurrent Neural Network,在常用的学习排序任务中,输入通常是语义的,并且具有良好的语法结构,就像问答排序任务一样。在这种情况下,CNN或LSTM是捕获QA对的潜在信息(本地或长相关性)的良好结构 但在现实中,有时我们只有短对和离散词。在这种情况下,CNN或LSTM仍然是一个公平的选择?或者是否有更合适的方法来处理此问题?更大的问题是您有多少训练数据。有很多有趣的工作,但深层神经网络方法倾向于使用QA排序任务的原因是,这些任务通常有数十万或数百万个训练示例 当您有较短的查询(即标题或web查询)时,您可能需要更多的数据来学

在常用的学习排序任务中,输入通常是语义的,并且具有良好的语法结构,就像问答排序任务一样。在这种情况下,CNN或LSTM是捕获QA对的潜在信息(本地或长相关性)的良好结构


但在现实中,有时我们只有短对和离散词。在这种情况下,CNN或LSTM仍然是一个公平的选择?或者是否有更合适的方法来处理此问题?

更大的问题是您有多少训练数据。有很多有趣的工作,但深层神经网络方法倾向于使用QA排序任务的原因是,这些任务通常有数十万或数百万个训练示例

当您有较短的查询(即标题或web查询)时,您可能需要更多的数据来学习,因为每个培训实例将使用较少的网络。这是可能的,但是您选择的方法通常应该基于您可用的培训数据,而不是查询的大小

  • [0-50查询]->手动调整、经过时间测试的模型,如查询可能性、BM25(或者如果您想要更好的结果,则使用ngram模型,如SDM)(如果您想要更多回忆,则使用伪相关反馈模型,如RM3)
  • [50-1000查询]->线性或基于树的排序方法学习
  • [10亿]->深度方法,或者可能仍在学习排名。我不确定有哪篇深度论文真正主导了最先进的梯度增强回归树设置

我的一位同事最近写的一篇论文。他们得到了很好的结果(比BM25好),但他们必须是谷歌(训练时间方面的)才能成功。

Thx,数据量决定NN的有效性是有道理的