Artificial intelligence 前馈神经网络训练的有效数据集大小_Artificial Intelligence_Machine Learning_Backpropagation_Neural Network

Artificial intelligence 前馈神经网络训练的有效数据集大小

artificial-intelligence machine-learning neural-network

Artificial intelligence 前馈神经网络训练的有效数据集大小,artificial-intelligence,machine-learning,backpropagation,neural-network,Artificial Intelligence,Machine Learning,Backpropagation,Neural Network,我正在使用python中的前馈神经网络实现。对于培训，我将使用反向传播算法。我知道，对于神经网络，我们需要恰到好处的数据量，以避免网络训练不足/过度。我可以为数据集获得大约1200个不同的训练数据模板所以问题是：如何计算培训的最佳数据量因为我已经尝试了数据集中的500个项目，并且花了很多小时才收敛，所以我不想尝试太大的尺寸。最后一个尺码的效果很好，但我想找到最佳的数量。神经网络约有7个输入、3个隐藏节点和一个输出如何计算最佳金额我的培训需要多少数据它完全依赖于解决方案。科学中也有一些艺

我正在使用python中的前馈神经网络实现。对于培训，我将使用反向传播算法。我知道，对于神经网络，我们需要恰到好处的数据量，以避免网络训练不足/过度。我可以为数据集获得大约1200个不同的训练数据模板
所以问题是：
如何计算培训的最佳数据量

因为我已经尝试了数据集中的500个项目，并且花了很多小时才收敛，所以我不想尝试太大的尺寸。最后一个尺码的效果很好，但我想找到最佳的数量。神经网络约有7个输入、3个隐藏节点和一个输出

如何计算最佳金额我的培训需要多少数据

它完全依赖于解决方案。科学中也有一些艺术。了解您是否进入过度拟合领域的唯一方法是定期根据一组验证数据（即您未接受培训的数据）测试您的网络。当这组数据的性能开始下降时，您可能已经训练得太多了--回滚到最后一次迭代

用这个效果很好最后一个尺码，但我想找到最佳量

“最优”不一定是可能的；这也取决于你的定义。您通常需要的是对给定权重集在看不见的数据上表现“良好”的高度信心。这就是验证集背后的想法。

数据集的多样性比您输入网络的样本数量更重要

您应该自定义您的数据集，以包括并加强您希望网络学习的数据

在您创建了这个自定义数据集之后，您必须开始处理样本量，因为它完全取决于您的问题

例如：如果你正在构建一个神经网络来检测特定信号的峰值，那么用无数个没有峰值的信号样本来训练你的网络是完全无用的。无论您有多少样本，定制您的培训数据集都很重要。

从技术上讲，在一般情况下，假设所有示例都是正确的，那么更多的示例总是更好的。问题是，边际改进（答案质量的一阶导数）是什么

您可以通过使用10个示例对其进行训练，检查质量（比如95%），然后检查20个，以此类推，以得到如下表格：

然后你可以清楚地看到你的边际收益，并据此做出决定。

是的，我考虑过了，这一步已经完成了。数据集是一个多样化的数据集，因为输入和输出是连续的，而不是离散的。我想我一直都知道这个答案，仍然希望有一些神奇的数字。这种几乎随机设置参数（基于感觉）的无助印象似乎与人工智能有关：）不过，谢谢。