Neural network 用于神经网络训练的数据集

Neural network 用于神经网络训练的数据集,neural-network,training-data,Neural Network,Training Data,我正在寻找一些相对简单的数据集,用于测试和比较人工神经网络的不同训练方法。我希望数据不需要太多的预处理就可以转换为输入和输出列表的输入格式(标准化为0-1)。任何链接都值得欣赏。为什么不尝试一些简单的函数,比如sin函数作为训练数据?由于您正在比较培训方法,并不真正关心您培训网络的目的,因此它应该可以工作,并且很容易生成培训数据 使用sin(x)训练网络,其中x是输入,输出是函数值。在您的案例中,另一个好处是结果的绝对值已经在0-1范围内。它同样适用于其他数学函数。我在本科时通过使用人工神经网络

我正在寻找一些相对简单的数据集,用于测试和比较人工神经网络的不同训练方法。我希望数据不需要太多的预处理就可以转换为输入和输出列表的输入格式(标准化为0-1)。任何链接都值得欣赏。

为什么不尝试一些简单的函数,比如sin函数作为训练数据?由于您正在比较培训方法,并不真正关心您培训网络的目的,因此它应该可以工作,并且很容易生成培训数据


使用sin(x)训练网络,其中x是输入,输出是函数值。在您的案例中,另一个好处是结果的绝对值已经在0-1范围内。它同样适用于其他数学函数。

我在本科时通过使用人工神经网络执行OCR(光学字符识别)来学习人工神经网络。我认为这是一个很好的用例

扫描两页文本,提取字母并形成培训/测试数据集(例如,8x8像素导致64个输入节点),标记数据。训练神经网络并使用测试数据集获得分数。改变网络拓扑/参数,调整网络以获得最佳分数。

< P>是加利福尼亚大学欧文知识库的机器学习数据集。这是一个非常棒的资源,我相信它们都在CSV文件中。

有些资源是

  • sinC函数

           +----
           |   sin(x)
           |  -------        when x != 0
           |     x
    sinC = |
           |
           |     1           otherwise
           +----
    
  • sin(x)
    的功能如@adrianbanks所述

  • 为了测试对某些算法的一些新的修改,使用了好的旧n-奇偶校验测试

  • 虹膜数据集,手写数字数据集等,任何其他功能和更多

  • UCI机器学习存储库:

  • 下面是另一个具有许多回归数据集的资源:。您将从UCI ML存储库中获得其中许多
  • 您可以从中获取各种实际数据集的数据集
我认为你不需要对这些进行大量的预处理。与分类变量一样,您可以使用GUI文本编辑器快速地将它们替换为二进制。例如,数据集有一个分类属性,即性别,它有三个值“M”表示男性,“F”表示女性,“I”表示婴儿。您可以在文本编辑器中按Ctrl+R,将所有出现的“M”替换为
1,0,0
,将所有出现的“F”替换为
0,1,0
,将所有出现的“I”替换为
0,0,1
(考虑到文件是CSV格式)。这将快速替换分类变量

如果您在中,则可以使用随附的
normalizeData
函数缩放和规范化0和1中的数据

如果您在其他环境中,比如或,您可以投入一些时间来编写代码。我不知道这些环境中是否有可用的函数,我使用代码来扩展和/或规范化数据

当您使用函数时,您的工作会变得更加简单,一旦准备好数据,请将修改后的数据保存到文件中

记住一件事,训练神经网络的目标不仅仅是训练网络,使其在特定的训练集上工作良好。主要目标是训练网络,使其对网络没有(直接或间接)看到的新数据具有最佳错误。


这里有许多示例项目和著名数据。

这里有一些手写和其他用于培训目的的数据库


有趣的是,~roweis在2010年与妻子打架后自杀:。

你可以找到一些有趣的数据集,从NLP、NER到图像分类,如下所示:

就我的两分钱:阿德里安班克斯所说的一切,再加上:在MS Excel中,您可以非常轻松地生成数据,创建一个数字范围从-180.0到180.0的列,增量为0.1,然后在第二列中添加一个带有“=SIN(A1)”的单元格,然后再填充该列。以CSV或任何您想要的格式导出数据。我还使用了x=x^2,x=x^3,x=x^4,x=sqrt(x)函数。