Artificial intelligence 前馈神经网络训练的有效数据集大小

Artificial intelligence 前馈神经网络训练的有效数据集大小,artificial-intelligence,machine-learning,backpropagation,neural-network,Artificial Intelligence,Machine Learning,Backpropagation,Neural Network,我正在使用python中的前馈神经网络实现。对于培训,我将使用反向传播算法。我知道,对于神经网络,我们需要恰到好处的数据量,以避免网络训练不足/过度。我可以为数据集获得大约1200个不同的训练数据模板 所以问题是: 如何计算培训的最佳数据量因为我已经尝试了数据集中的500个项目,并且花了很多小时才收敛,所以我不想尝试太大的尺寸。最后一个尺码的效果很好,但我想找到最佳的数量。神经网络约有7个输入、3个隐藏节点和一个输出 如何计算最佳金额 我的培训需要多少数据 它完全依赖于解决方案。科学中也有一些艺


我正在使用python中的前馈神经网络实现。对于培训,我将使用反向传播算法。我知道,对于神经网络,我们需要恰到好处的数据量,以避免网络训练不足/过度。我可以为数据集获得大约1200个不同的训练数据模板
所以问题是:
如何计算培训的最佳数据量

因为我已经尝试了数据集中的500个项目,并且花了很多小时才收敛,所以我不想尝试太大的尺寸。最后一个尺码的效果很好,但我想找到最佳的数量。神经网络约有7个输入、3个隐藏节点和一个输出

如何计算最佳金额 我的培训需要多少数据

它完全依赖于解决方案。科学中也有一些艺术。了解您是否进入过度拟合领域的唯一方法是定期根据一组验证数据(即您未接受培训的数据)测试您的网络。当这组数据的性能开始下降时,您可能已经训练得太多了--回滚到最后一次迭代

用这个效果很好 最后一个尺码,但我想找到 最佳量


“最优”不一定是可能的;这也取决于你的定义。您通常需要的是对给定权重集在看不见的数据上表现“良好”的高度信心。这就是验证集背后的想法。

数据集的多样性比您输入网络的样本数量更重要

您应该自定义您的数据集,以包括并加强您希望网络学习的数据

在您创建了这个自定义数据集之后,您必须开始处理样本量,因为它完全取决于您的问题


例如:如果你正在构建一个神经网络来检测特定信号的峰值,那么用无数个没有峰值的信号样本来训练你的网络是完全无用的。无论您有多少样本,定制您的培训数据集都很重要。

从技术上讲,在一般情况下,假设所有示例都是正确的,那么更多的示例总是更好的。问题是,边际改进(答案质量的一阶导数)是什么

您可以通过使用10个示例对其进行训练,检查质量(比如95%),然后检查20个,以此类推,以得到如下表格:

10 95%
20 96%
30 96.5%
40 96.55%
50 96.56%

然后你可以清楚地看到你的边际收益,并据此做出决定。

是的,我考虑过了,这一步已经完成了。数据集是一个多样化的数据集,因为输入和输出是连续的,而不是离散的。我想我一直都知道这个答案,仍然希望有一些神奇的数字。这种几乎随机设置参数(基于感觉)的无助印象似乎与人工智能有关:)不过,谢谢。