Neural network 神经网络数据集的总大小是多少?

Neural network 神经网络数据集的总大小是多少?,neural-network,Neural Network,实际上,关于神经网络数据集的训练规模有很多问题。但我的问题是神经网络数据集的总体大小。 我在这里找到了一个与用户知识建模主题相关的数据集。 此数据集有403个实例。我想和安和安菲斯一起工作。 现在我的问题是,数据集的大小是否会影响最终结果?我应该使用另一个包含更多实例的数据集吗? 请注意,我的问题不是关于培训、测试和验证数据的百分比。 当然,数据集的大小会影响任何机器学习算法的性能 在统计观点下,如果数据集很小,您可能无法捕获要建模的分布的统计信息。 一个更“实际”的问题是,无论是训练集还是测试

实际上,关于神经网络数据集的训练规模有很多问题。但我的问题是神经网络数据集的总体大小。 我在这里找到了一个与用户知识建模主题相关的数据集。 此数据集有403个实例。我想和安和安菲斯一起工作。 现在我的问题是,数据集的大小是否会影响最终结果?我应该使用另一个包含更多实例的数据集吗? 请注意,我的问题不是关于培训、测试和验证数据的百分比。
当然,数据集的大小会影响任何机器学习算法的性能

在统计观点下,如果数据集很小,您可能无法捕获要建模的分布的统计信息。 一个更“实际”的问题是,无论是训练集还是测试/验证集,您的模型都可能过度拟合数据集

这里还有另一个问题,那就是你是否在使用“好的”特性作为神经网络的输入。在本文中,Good指的是真正描述您感兴趣的类的特性


一种常见的方法是扩充您的数据集。您可以对训练集使用或应用一些随机变换,但后者主要用于图像。

要确认Flavio Ferrara的回答,您必须记住,模型中自由参数的数量与训练集的大小之间始终存在严格的关系。神经网络中自由参数(权重和偏差值)的数量也与网络的结构有关

随着自由参数数量的增加,您需要更多的数据来估计其真实值,如果您不能这样做,您的模型往往会与训练数据过度拟合。 简言之,回答您的训练集是否满足您的模型的问题,与您的模型中的自由参数数量密切相关。需要估计的参数越多,需要的训练集就越大。另一方面,对于ANN,体系结构会增加参数的数量

希望能有帮助