Machine learning 验证集在机器学习研究论文中是否至关重要?

Machine learning 验证集在机器学习研究论文中是否至关重要?,machine-learning,deep-learning,dataset,data-science,training-data,Machine Learning,Deep Learning,Dataset,Data Science,Training Data,我知道验证集非常重要,因为简而言之,我们可以检查我们的模型并调整最佳超参数,而无需处理测试集。然而,有一些关于机器学习的论文没有建立验证集。例如,在中,作者提到他们使用验证集来调整超参数,但前提是他们仅使用训练集训练模型,并使用每个历元的测试集对其进行验证 for epoch in xrange(epochs): t1 = time() # Generate training instances user_input, item_input, labels = get_t

我知道验证集非常重要,因为简而言之,我们可以检查我们的模型并调整最佳超参数,而无需处理测试集。然而,有一些关于机器学习的论文没有建立验证集。例如,在中,作者提到他们使用验证集来调整超参数,但前提是他们仅使用训练集训练模型,并使用每个历元的测试集对其进行验证

for epoch in xrange(epochs):
    t1 = time()
    # Generate training instances
    user_input, item_input, labels = get_train_instances(train, num_negatives)

    # Training
    hist = model.fit([np.array(user_input), np.array(item_input)], #input
                     np.array(labels), # labels 
                     batch_size=batch_size, nb_epoch=1, verbose=0, shuffle=True)
    t2 = time()

    # Evaluation
    if epoch %verbose == 0:
        (hits, ndcgs) = evaluate_model(model, testRatings, testNegatives, topK, evaluation_threads)
        hr, ndcg, loss = np.array(hits).mean(), np.array(ndcgs).mean(), hist.history['loss'][0]
        print('Iteration %d [%.1f s]: HR = %.4f, NDCG = %.4f, loss = %.4f [%.1f s]' 
              % (epoch,  t2-t1, hr, ndcg, loss, time()-t2))
        if hr > best_hr:
            best_hr, best_ndcg, best_iter = hr, ndcg, epoch
            if args.out > 0:
                model.save_weights(model_out_file, overwrite=True)
我在github中找不到任何制作或处理验证集的代码。 在任何类型的机器学习研究中使用测试集而不是验证集可以吗?同时,在我看来,我们应该在像Kaggle或现实系统这样的比赛中使用验证集