在这些数据集之间,用R进行深度学习导致MAE结果差异的原因是什么?
我试图用另一个来源的相同波士顿住房数据集复制下面的深度学习示例 最初,数据源是:在这些数据集之间,用R进行深度学习导致MAE结果差异的原因是什么?,r,machine-learning,keras,deep-learning,R,Machine Learning,Keras,Deep Learning,我试图用另一个来源的相同波士顿住房数据集复制下面的深度学习示例 最初,数据源是: library(keras) dataset <- dataset_boston_housing() 数据集之间的差异如下: mlbench中的数据集包含列名 来自keras的数据集已在测试和训练之间分割 来自keras的数据集由包含矩阵的列表组织,而来自mlbench的数据集是一个数据帧 第四列包含一个分类变量“chas”,该变量无法从mlbench数据集预处理,而可以从keras数据集预处理。为了比较
library(keras) dataset <- dataset_boston_housing()
数据集之间的差异如下:
图书馆(keras)
数据集写在这里,因为我不能评论。。。
我检查了mlbench数据集,它说,它包含原始boston数据集的14列和另外5列。不确定是否有错误的数据集,因为您声明数据集的列计数没有差异
另一种猜测可能是,第二个示例图来自一个陷入局部极小的模型。要获得更具可比性的模型,您可能需要使用相同的种子,以确保权重等的日化是相同的,从而获得相同的结果
希望这对您有所帮助,请随意提问。谢谢Fabian。我使用了14列的数据集,因为该数据集与Keras数据集相同。下载后,Keras数据集已在测试和训练中拆分。我无法使用mlbench数据集复制此精确拆分。出于这个原因,我故意在没有相同种子的情况下多次使用mlbench数据集重新运行代码,尽管它从未从keras数据集达到MAE 2.5。因此,您的样本量非常小……您是否已经比较了mlbench和keras数据集列车集的每个特征的summary()?因为你的代码看起来很好。是的,请看我上面的文字。它们完全相同。我可以想象,由于样本量小,结果是不稳定的,尽管奇怪的是,我从来没有达到2.5,并保持在4到6之间。因此,我想知道Keras是否会因为dataframe vs matrix或类似的原因而对这两个数据集进行不同的处理。我还向Keras数据集添加了列标题(类似于mlbench数据集),尽管这没有什么区别。
library(mlbench)
data(BostonHousing)