Neural network 如何在短对排序中使用学习对模型（CNN、LSTM）进行排序？_Neural Network_Nlp_Conv Neural Network_Information Retrieval_Recurrent Neural Network

Neural network 如何在短对排序中使用学习对模型（CNN、LSTM）进行排序？

neural-network nlp

Neural network 如何在短对排序中使用学习对模型（CNN、LSTM）进行排序？,neural-network,nlp,conv-neural-network,information-retrieval,recurrent-neural-network,Neural Network,Nlp,Conv Neural Network,Information Retrieval,Recurrent Neural Network,在常用的学习排序任务中，输入通常是语义的，并且具有良好的语法结构，就像问答排序任务一样。在这种情况下，CNN或LSTM是捕获QA对的潜在信息（本地或长相关性）的良好结构但在现实中，有时我们只有短对和离散词。在这种情况下，CNN或LSTM仍然是一个公平的选择？或者是否有更合适的方法来处理此问题？更大的问题是您有多少训练数据。有很多有趣的工作，但深层神经网络方法倾向于使用QA排序任务的原因是，这些任务通常有数十万或数百万个训练示例当您有较短的查询（即标题或web查询）时，您可能需要更多的数据来学

在常用的学习排序任务中，输入通常是语义的，并且具有良好的语法结构，就像问答排序任务一样。在这种情况下，CNN或LSTM是捕获QA对的潜在信息（本地或长相关性）的良好结构

但在现实中，有时我们只有短对和离散词。在这种情况下，CNN或LSTM仍然是一个公平的选择？或者是否有更合适的方法来处理此问题？

更大的问题是您有多少训练数据。有很多有趣的工作，但深层神经网络方法倾向于使用QA排序任务的原因是，这些任务通常有数十万或数百万个训练示例

当您有较短的查询（即标题或web查询）时，您可能需要更多的数据来学习，因为每个培训实例将使用较少的网络。这是可能的，但是您选择的方法通常应该基于您可用的培训数据，而不是查询的大小

[0-50查询]->手动调整、经过时间测试的模型，如查询可能性、BM25（或者如果您想要更好的结果，则使用ngram模型，如SDM）（如果您想要更多回忆，则使用伪相关反馈模型，如RM3）
[50-1000查询]->线性或基于树的排序方法学习
[10亿]->深度方法，或者可能仍在学习排名。我不确定有哪篇深度论文真正主导了最先进的梯度增强回归树设置

我的一位同事最近写的一篇论文。他们得到了很好的结果（比BM25好），但他们必须是谷歌（训练时间方面的）才能成功。

Thx，数据量决定NN的有效性是有道理的