Nlp 我应该使用什么评估指标来比较基于知识的方法和生成模型?

Nlp 我应该使用什么评估指标来比较基于知识的方法和生成模型?,nlp,deep-learning,chatbot,precision-recall,rnn,Nlp,Deep Learning,Chatbot,Precision Recall,Rnn,我和我的团队正在为技术支持开发一个聊天机器人,我们有两个模型——使用rnn算法的生成模型和使用NLP的基于知识的方法。我想知道,如果我想比较这两个模型,我应该使用什么评估指标。对于生成模型,我可以使用recall@k米制的是否有任何行业标准将rnn算法与基于知识的方法进行比较?嗯,这取决于具体情况。你想优化什么?聊天机器人是否应该在现有知识库中查找答案?您是否有金标准数据集或手动注释可供比较?这取决于。你想优化什么?聊天机器人是否应该在现有知识库中查找答案?您是否有金标准数据集或手动注释可供比较

我和我的团队正在为技术支持开发一个聊天机器人,我们有两个模型——使用rnn算法的生成模型和使用NLP的基于知识的方法。我想知道,如果我想比较这两个模型,我应该使用什么评估指标。对于生成模型,我可以使用recall@k米制的是否有任何行业标准将rnn算法与基于知识的方法进行比较?

嗯,这取决于具体情况。你想优化什么?聊天机器人是否应该在现有知识库中查找答案?您是否有金标准数据集或手动注释可供比较?这取决于。你想优化什么?聊天机器人是否应该在现有知识库中查找答案?您是否有金标准数据集或手动注释可供比较?