Neural network 为MLP和Hopfield网络选择训练和测试集

Neural network 为MLP和Hopfield网络选择训练和测试集,neural-network,training-data,test-data,Neural Network,Training Data,Test Data,我有一个关于多层感知器(MLP)和Hopfield网络的训练和测试集选择的问题 例如,假设我们得到了100个位图格式的数字0-9的模式。其中10个是完美数字,而另外90个是失真数字。这些模式中的哪些将用于训练集,哪些将用于测试集?目标是对数字进行分类 我想对于Hopfield网络,完美数字将用作训练集,但是MLP呢?我想到的一种方法是以70个扭曲的数字为例,将它们作为训练集,并将相应的完美数字作为其预期目标。这种方法正确吗?免责声明:我以前没有与Hopfield Networks合作过,所以我相

我有一个关于多层感知器(MLP)和Hopfield网络的训练和测试集选择的问题

例如,假设我们得到了100个位图格式的数字0-9的模式。其中10个是完美数字,而另外90个是失真数字。这些模式中的哪些将用于训练集,哪些将用于测试集?目标是对数字进行分类


我想对于Hopfield网络,完美数字将用作训练集,但是MLP呢?我想到的一种方法是以70个扭曲的数字为例,将它们作为训练集,并将相应的完美数字作为其预期目标。这种方法正确吗?

免责声明:我以前没有与Hopfield Networks合作过,所以我相信你关于它的陈述,但无论如何,它不应该与答案有太大的相关性。
我还假设您想要对数字进行分类,这是您在问题中没有明确说明的

至于适当的划分:除了很少的训练数据通常不可能为MLP(即使对于数字分类这样的简单任务)获得理想的结果这一事实之外,在大多数真实场景中,你不太可能“预先标记”你的训练数据的质量。因此,您应该始终假定您正在处理的数据本身就是有噪声的。一个很好的例子是,它经常被用来丰富你的训练语料库。因为数据扩充可以由以下简单的更改组成:

  • 附加噪声
  • 小旋转
  • 水平/垂直翻转(但后者仅对数字有意义)
可以提高你的准确性,这表明训练的视觉质量和数量是两件截然不同的事情。当然,单凭数量本身并不能解决你的问题(尽管研究表明这至少是一个问题)

此外,您判断为良好的表示可能与网络的角度有很大不同(尽管标记数字可能很容易分辨)。因此,一个合理的策略是简单地对训练/测试进行随机抽样

在预处理数据集时,我喜欢做的一件事是,当完成拆分时,检查是否每个类在拆分中都有一定程度的均匀表示,这样您就不会过度拟合。
类似地,我认为在测试集和训练集中都有清晰/高质量的数字图像可能是最有意义的,因为您希望两者都能够识别高质量的数字,以及书写不规范的数字,然后测试您是否能够(使用您的测试集)真正识别它.

这个问题是理论层面的,而不是实际的word实现,因此训练数据的数量只是一个例子。此外,我还编辑了我的问题,以指定目标,即数字的分类。对于理论问题,我总是建议更多地关注数字的方向。虽然,在这个具体的例子中,即使从你的理论观点来看,我的论点仍然是:在测试和训练中都抽取完美的例子是可行的。我看不出有什么理由你会忽视对它们进行培训的机会,而且显然你也希望为不完美留下空间(因此,不要在培训集中使用所有完美的例子可能是个好主意)。