Neural network 为MLP和Hopfield网络选择训练和测试集
我有一个关于多层感知器(MLP)和Hopfield网络的训练和测试集选择的问题 例如,假设我们得到了100个位图格式的数字0-9的模式。其中10个是完美数字,而另外90个是失真数字。这些模式中的哪些将用于训练集,哪些将用于测试集?目标是对数字进行分类Neural network 为MLP和Hopfield网络选择训练和测试集,neural-network,training-data,test-data,Neural Network,Training Data,Test Data,我有一个关于多层感知器(MLP)和Hopfield网络的训练和测试集选择的问题 例如,假设我们得到了100个位图格式的数字0-9的模式。其中10个是完美数字,而另外90个是失真数字。这些模式中的哪些将用于训练集,哪些将用于测试集?目标是对数字进行分类 我想对于Hopfield网络,完美数字将用作训练集,但是MLP呢?我想到的一种方法是以70个扭曲的数字为例,将它们作为训练集,并将相应的完美数字作为其预期目标。这种方法正确吗?免责声明:我以前没有与Hopfield Networks合作过,所以我相
我想对于Hopfield网络,完美数字将用作训练集,但是MLP呢?我想到的一种方法是以70个扭曲的数字为例,将它们作为训练集,并将相应的完美数字作为其预期目标。这种方法正确吗?免责声明:我以前没有与Hopfield Networks合作过,所以我相信你关于它的陈述,但无论如何,它不应该与答案有太大的相关性。
我还假设您想要对数字进行分类,这是您在问题中没有明确说明的 至于适当的划分:除了很少的训练数据通常不可能为MLP(即使对于数字分类这样的简单任务)获得理想的结果这一事实之外,在大多数真实场景中,你不太可能“预先标记”你的训练数据的质量。因此,您应该始终假定您正在处理的数据本身就是有噪声的。一个很好的例子是,它经常被用来丰富你的训练语料库。因为数据扩充可以由以下简单的更改组成:
- 附加噪声
- 小旋转
- 水平/垂直翻转(但后者仅对数字有意义)
类似地,我认为在测试集和训练集中都有清晰/高质量的数字图像可能是最有意义的,因为您希望两者都能够识别高质量的数字,以及书写不规范的数字,然后测试您是否能够(使用您的测试集)真正识别它.这个问题是理论层面的,而不是实际的word实现,因此训练数据的数量只是一个例子。此外,我还编辑了我的问题,以指定目标,即数字的分类。对于理论问题,我总是建议更多地关注数字的方向。虽然,在这个具体的例子中,即使从你的理论观点来看,我的论点仍然是:在测试和训练中都抽取完美的例子是可行的。我看不出有什么理由你会忽视对它们进行培训的机会,而且显然你也希望为不完美留下空间(因此,不要在培训集中使用所有完美的例子可能是个好主意)。