Neural network encog 3.0的CSV类型培训数据格式及其使用

Neural network encog 3.0的CSV类型培训数据格式及其使用,neural-network,encog,Neural Network,Encog,我想知道如何制作一个csv文件,用于将培训数据存储在encog中。目前我有200个特征(f)作为输入和多输出(o)(例如作者A、B、C…)。那么如何组织CSV文件呢?我应该像这样吗 f1, f2, f3 ... f200, o1 f1, f2, f3 ... f200, o2 f1, f2, f3 ... f200, o3 我的一些问题是: o1、o2和o3可以接受字符串吗?(作者姓名) 培训csv文件和测试cvs文件的格式是否相同 是否可以直接向NN提供CSV文件?或者它必须转换为多维数组

我想知道如何制作一个csv文件,用于将培训数据存储在encog中。目前我有200个特征(f)作为输入和多输出(o)(例如作者A、B、C…)。那么如何组织CSV文件呢?我应该像这样吗

f1, f2, f3 ... f200, o1
f1, f2, f3 ... f200, o2
f1, f2, f3 ... f200, o3
我的一些问题是:

  • o1、o2和o3可以接受字符串吗?(作者姓名)
  • 培训csv文件和测试cvs文件的格式是否相同
  • 是否可以直接向NN提供CSV文件?或者它必须转换为多维数组,如本例所示?由于我必须输入200个特性,这将非常困难
  • 如何使用encog框架规范化csv文件中的数据(到-+1范围)

非常感谢。

否。神经网络只对浮点数进行操作,最好是0到1(输出)或-1到1(输入)。对于字符串,使用n中的1编码

所以,例如,如果您的输出是“a”、“b”、“c”,则将其设置为

1 0 0       = 'a'
0 1 0       = 'b'
0 0 1       = 'c'
如果没有找到结果,您还可以在必要时添加null类。 您可以从csv读取数据,但encog正在二维双数组(或者更准确地说是“数组数组”)中查找所有内容。 为了简化事情,从10个特性开始

标准化是针对每个特性进行的。因此,对于每个特征,数据点a的标准化公式为:

((a-min)/范围)+1

其中
范围=该特性的最大-最小值

所以所有的输入数据点都应该在-1到1之间

也许发布一个真实的数据示例,这可能会让您更好地了解您需要做什么

1 0 0       = 'a'
0 1 0       = 'b'
0 0 1       = 'c'