C MLP训练:如何处理未知特征值

C MLP训练:如何处理未知特征值,c,neural-network,fann,C,Neural Network,Fann,假设我们有一个MLP要用一组特征向量进行训练,使得其中一些向量包含未知值。我该怎么处理?MLP能做到这一点吗 假设训练向量为: (1.0, 3.4, unknown, 2.0), (3.1, unknown, 1.2, 0.1), (2.1,3.4,1.2,4.5), ... 我正在使用FANN。缺少数据 您指的是数据丢失问题。鲁宾1987。这不是神经网络分类器能够单独处理的事情。您应该预处理数据,并尝试通过基于已知实例变量值1或更高级算法2的简单统计估计值来填充缺失的数据 1举例来说: 2.

假设我们有一个MLP要用一组特征向量进行训练,使得其中一些向量包含未知值。我该怎么处理?MLP能做到这一点吗

假设训练向量为:

(1.0, 3.4, unknown, 2.0), (3.1, unknown, 1.2, 0.1), (2.1,3.4,1.2,4.5), ...
我正在使用FANN。

缺少数据 您指的是数据丢失问题。鲁宾1987。这不是神经网络分类器能够单独处理的事情。您应该预处理数据,并尝试通过基于已知实例变量值1或更高级算法2的简单统计估计值来填充缺失的数据

1举例来说: 2.EM算法 这是一个更复杂的算法,用于寻找缺失数据的近似估计值。阅读算法简介

instance1 = 0, 0, 1, 0, 1
instance2 = 0, 0, 1, 0, 1
instance3 = 1, 1, 1, 0, 0
instanceX = 1, 1, 1, 0, ?

# The statistical approach
We can see that instanceX shares a lot of instance3's features,
thus we will set the unknown variable accoring to instance3's defined value: 0
# The mean
We could calculate the dataset's mean value for this variable and
use the calculated value: 1