Neural network 为MLP和Hopfield网络选择训练和测试集_Neural Network_Training Data_Test Data

Neural network 为MLP和Hopfield网络选择训练和测试集

neural-network

Neural network 为MLP和Hopfield网络选择训练和测试集,neural-network,training-data,test-data,Neural Network,Training Data,Test Data,我有一个关于多层感知器（MLP）和Hopfield网络的训练和测试集选择的问题例如，假设我们得到了100个位图格式的数字0-9的模式。其中10个是完美数字，而另外90个是失真数字。这些模式中的哪些将用于训练集，哪些将用于测试集？目标是对数字进行分类我想对于Hopfield网络，完美数字将用作训练集，但是MLP呢？我想到的一种方法是以70个扭曲的数字为例，将它们作为训练集，并将相应的完美数字作为其预期目标。这种方法正确吗？免责声明：我以前没有与Hopfield Networks合作过，所以我相

我有一个关于多层感知器（MLP）和Hopfield网络的训练和测试集选择的问题

例如，假设我们得到了100个位图格式的数字0-9的模式。其中10个是完美数字，而另外90个是失真数字。这些模式中的哪些将用于训练集，哪些将用于测试集？目标是对数字进行分类

我想对于Hopfield网络，完美数字将用作训练集，但是MLP呢？我想到的一种方法是以70个扭曲的数字为例，将它们作为训练集，并将相应的完美数字作为其预期目标。这种方法正确吗？

免责声明：我以前没有与Hopfield Networks合作过，所以我相信你关于它的陈述，但无论如何，它不应该与答案有太大的相关性。
我还假设您想要对数字进行分类，这是您在问题中没有明确说明的

至于适当的划分：除了很少的训练数据通常不可能为MLP（即使对于数字分类这样的简单任务）获得理想的结果这一事实之外，在大多数真实场景中，你不太可能“预先标记”你的训练数据的质量。因此，您应该始终假定您正在处理的数据本身就是有噪声的。一个很好的例子是，它经常被用来丰富你的训练语料库。因为数据扩充可以由以下简单的更改组成：

附加噪声
小旋转
水平/垂直翻转（但后者仅对数字有意义）

可以提高你的准确性，这表明训练的视觉质量和数量是两件截然不同的事情。当然，单凭数量本身并不能解决你的问题（尽管研究表明这至少是一个问题）

此外，您判断为良好的表示可能与网络的角度有很大不同（尽管标记数字可能很容易分辨）。因此，一个合理的策略是简单地对训练/测试进行随机抽样

在预处理数据集时，我喜欢做的一件事是，当完成拆分时，检查是否每个类在拆分中都有一定程度的均匀表示，这样您就不会过度拟合。

类似地，我认为在测试集和训练集中都有清晰/高质量的数字图像可能是最有意义的，因为您希望两者都能够识别高质量的数字，以及书写不规范的数字，然后测试您是否能够（使用您的测试集）真正识别它.

这个问题是理论层面的，而不是实际的word实现，因此训练数据的数量只是一个例子。此外，我还编辑了我的问题，以指定目标，即数字的分类。对于理论问题，我总是建议更多地关注数字的方向。虽然，在这个具体的例子中，即使从你的理论观点来看，我的论点仍然是：在测试和训练中都抽取完美的例子是可行的。我看不出有什么理由你会忽视对它们进行培训的机会，而且显然你也希望为不完美留下空间（因此，不要在培训集中使用所有完美的例子可能是个好主意）。