Machine learning apache spark ML库中SVM中缺失值的处理

Machine learning apache spark ML库中SVM中缺失值的处理,machine-learning,svm,apache-spark-mllib,Machine Learning,Svm,Apache Spark Mllib,我有一个分类任务。我想使用ApacheSpark ml lib SVM算法进行分类。我有n维的输入数据。在特征向量中,可能缺少一些维度 如何处理缺少的值?我认为将缺失的值假定为零或其他东西是错误的。对。ML Lib不会插补缺失的值,而填入0将扭曲结果。然而,WEKA有一个ReplaceMissingValues软件包可能对您有用;这实现了一种插补算法 对。ML Lib不会插补缺失的值,而填入0将扭曲结果。然而,WEKA有一个ReplaceMissingValues软件包可能对您有用;这实现了一种

我有一个分类任务。我想使用ApacheSpark ml lib SVM算法进行分类。我有n维的输入数据。在特征向量中,可能缺少一些维度


如何处理缺少的值?我认为将缺失的值假定为零或其他东西是错误的。

对。ML Lib不会插补缺失的值,而填入0将扭曲结果。然而,WEKA有一个ReplaceMissingValues软件包可能对您有用;这实现了一种插补算法

对。ML Lib不会插补缺失的值,而填入0将扭曲结果。然而,WEKA有一个ReplaceMissingValues软件包可能对您有用;这实现了一种插补算法

您有两个选择: 1-忽略缺少值的向量 2-只需输入缺失值,即可使用平均值或模式值

我建议使用spark,这是一个非常简单的代码,这里有一个示例:

您有两个选择: 1-忽略缺少值的向量 2-只需输入缺失值,即可使用平均值或模式值

我建议使用spark,这是一个非常简单的代码,这里有一个示例: