Machine learning 训练数据集和测试数据集是否可以分开而不是分开

Machine learning 训练数据集和测试数据集是否可以分开而不是分开,machine-learning,data-science,data-science-experience,Machine Learning,Data Science,Data Science Experience,我们能否为培训和测试提供单独的数据集。 我正在做一个项目来获取有效的测试用例 作为这项工作的一部分,我分析了bug数据库,提出了产生bug的触发器,并得出了一个模型。所以这个bug数据库构成了我的训练集。 我编写的测试用例是我的测试数据,我必须将这些测试数据提供给模型,以说明测试用例是否有效。 因此,在本例中,我必须有两个不同的数据集(来自bug数据库的测试数据)和训练数据(手动生成的测试用例),而不是将数据集拆分为训练数据和测试数据 这是机器学习可以做到的吗?请告诉我。是的,培训数据集和测试数

我们能否为培训和测试提供单独的数据集。 我正在做一个项目来获取有效的测试用例 作为这项工作的一部分,我分析了bug数据库,提出了产生bug的触发器,并得出了一个模型。所以这个bug数据库构成了我的训练集。 我编写的测试用例是我的测试数据,我必须将这些测试数据提供给模型,以说明测试用例是否有效。 因此,在本例中,我必须有两个不同的数据集(来自bug数据库的测试数据)和训练数据(手动生成的测试用例),而不是将数据集拆分为训练数据和测试数据
这是机器学习可以做到的吗?请告诉我。

是的,培训数据集和测试数据集可以是单独的文件。在现实世界中,测试数据通常是一些单独的看不见的数据集


要遵循的主要原则是,在训练模型时,必须将数据集分开(保持集)进行测试。这些数据可以在不同的文件、数据库中单独提供,甚至可以使用拆分生成。这样做是为了避免数据泄漏(当测试数据以某种方式用于训练模型时)。

我投票结束这个问题,因为它不是关于中定义的编程,而是关于ML理论和/或方法-请参阅机器学习中的介绍和注记。。非常感谢您提供的信息。因此,从缺陷分析中,我们应该能够对数据(多类)分类,并得出一个模型,将测试用例(训练集)提供给该模型,以获得有效的测试用例。是的,在训练数据集上进行训练,并使用训练过的模型对测试数据进行预测。