SSAS数据挖掘:测试和培训数据集…请解释

SSAS数据挖掘:测试和培训数据集…请解释,ssas,Ssas,有人能解释一下,当您将数据集拆分以进行测试和训练时会发生什么情况吗?简单地说,数据挖掘模型的准确性是通过基于您的训练集(其结果在测试集中已经知道)进行预测来评估的 为了能够测试您构建的预测分析模型,您需要将数据集分为两组:训练数据集和测试数据集。这些数据集应随机选择,并应能很好地代表实际人口 Similar data should be used for both the training and test datasets. Normally the training dataset is

有人能解释一下,当您将数据集拆分以进行测试和训练时会发生什么情况吗?

简单地说,数据挖掘模型的准确性是通过基于您的训练集(其结果在测试集中已经知道)进行预测来评估的


为了能够测试您构建的预测分析模型,您需要将数据集分为两组:训练数据集和测试数据集。这些数据集应随机选择,并应能很好地代表实际人口

Similar data should be used for both the training and test datasets.

Normally the training dataset is significantly larger than the test dataset.

Using the test dataset helps you avoid errors such as overfitting.

The trained model is run against test data to see how well the model will perform.