Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/svn/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Validation 如何从交叉验证的数据中创建学习曲线?_Validation_Machine Learning_Artificial Intelligence_Neural Network_Cross Validation - Fatal编程技术网

Validation 如何从交叉验证的数据中创建学习曲线?

Validation 如何从交叉验证的数据中创建学习曲线?,validation,machine-learning,artificial-intelligence,neural-network,cross-validation,Validation,Machine Learning,Artificial Intelligence,Neural Network,Cross Validation,我有一个使用10倍交叉验证的算法。在训练集中,我使用其中一个折叠来验证训练模型,然后将学习到的模型放在折叠上进行测试 我想创建一个学习曲线,这意味着我需要改变训练集的大小。这是否意味着我还可以随培训数据改变验证集的大小?这是否意味着我也需要更改测试集的大小(除了训练和验证折叠之外的折叠集)?10倍交叉验证将标记数据的训练集划分为10个大小相等的子集。其中9个子集被合并到新的训练集中,剩下的1个子集用于验证/测试,即模型在原始训练集中的90%上进行训练,在10%上进行测试 这将在10个子集中的每个

我有一个使用10倍交叉验证的算法。在训练集中,我使用其中一个折叠来验证训练模型,然后将学习到的模型放在折叠上进行测试


我想创建一个学习曲线,这意味着我需要改变训练集的大小。这是否意味着我还可以随培训数据改变验证集的大小?这是否意味着我也需要更改测试集的大小(除了训练和验证折叠之外的折叠集)?

10倍交叉验证将标记数据的训练集划分为10个大小相等的子集。其中9个子集被合并到新的训练集中,剩下的1个子集用于验证/测试,即模型在原始训练集中的90%上进行训练,在10%上进行测试

这将在10个子集中的每个子集中重复执行10次(折叠),因此每个子集中都用于测试。在每次迭代中执行测试的性能度量,在所有迭代完成后,计算平均值

没有所谓的“训练折叠”或“测试折叠”,折叠是过程的迭代。在这个过程中也没有保留子集,所有子集都在每次迭代中使用


要创建您正在谈论的学习曲线,您只需改变原始训练集的大小,并让10倍交叉验证过程按原样运行即可。原始培训集中的记录数是您对培训集大小的度量,性能是交叉验证完成时给定的平均值。

您能澄清第一段吗?10倍CV包括将数据分成10个大致相等的部分。9号训练,10号测试。您似乎预留了2倍?验证集是优化(超)参数的集合,例如,SVM的C;测试集是评估模型性能的集合。你打算优化参数并在同一组上测试模型吗?@NikitaAstrakhantsev我想你是对的,当使用我想要的含义(编辑)时,说“测试集”而不是“验证集”更正确。我只提到使用简历进行绩效验证。有些算法不需要参数调整,但在这种情况下(如支持向量机和神经网络),通常将测试集划分为验证和测试部分。