如何从Matlab或Excel中填充缺失的数据集
我有一个数据集(每日和每月降雨量数据),但它缺少太多的价值。 为了训练数据,我需要填充缺失的数据,你能告诉我怎么做吗?我使用了SPSS统计软件,但似乎数值不好,或者可能我使用了错误的方法如何从Matlab或Excel中填充缺失的数据集,excel,matlab,neural-network,missing-data,Excel,Matlab,Neural Network,Missing Data,我有一个数据集(每日和每月降雨量数据),但它缺少太多的价值。 为了训练数据,我需要填充缺失的数据,你能告诉我怎么做吗?我使用了SPSS统计软件,但似乎数值不好,或者可能我使用了错误的方法 sample: Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec 3 3 5 5 6 7 8 7 8 9 NaN 4 NaN 3 NaN 5 NaN 3 4 NaN 4 6
sample:
Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
3 3 5 5 6 7 8 7 8 9 NaN 4
NaN 3 NaN 5 NaN 3 4 NaN 4 6 7 8
7 NaN 4 7 8 9 4 2 NaN 4 6 5
.....................................................
另一个问题是,大部分训练前的数据应该是标准化数据,这是正确的吗?
谢谢你的回答!
祝大家圣诞快乐 对于丢失的数据,您可以选择采用现有数据的
平均值来模拟丢失的数据。例如,取mean(3,7)=5
填充Jan
中的NaN
,依此类推。我认为这可能是最简单的方法。你也可以考虑矩阵分解和曲线拟合。
对于规范化,一些分类器不需要规范化数据。然而,规范化数据通常是提高性能的一种好做法。对于神经网络,众所周知,归一化数据更受青睐。所以不要犹豫。对于丢失的数据,您可以选择使用现有数据的平均值来模拟丢失的数据。例如,取mean(3,7)=5
填充Jan
中的NaN
,依此类推。我认为这可能是最简单的方法。你也可以考虑矩阵分解和曲线拟合。
对于规范化,一些分类器不需要规范化数据。然而,规范化数据通常是提高性能的一种好做法。对于神经网络,众所周知,归一化数据更受青睐。所以不要犹豫。按Ctrl+G
,然后单击Special
,然后检查公式
,然后确保只选中了错误
,然后单击确定
。这将选择所有有错误的单元格。然后,您可以按Delete
清除其内容
有时我会创建第二个表,其中包含将一个表的值转换为原始值或更易于管理的公式(如建议)。按Ctrl+G
,然后单击Special
,然后选中formulas
,然后确保只选中了Errors
,然后单击OK
。这将选择所有有错误的单元格。然后,您可以按Delete
清除其内容
有时我会创建第二个表,其中包含将一个表的值转换为原始值或更易于管理的公式(如建议)。您可能需要查看MATLAB曲线拟合工具箱。到目前为止,您做了哪些尝试?请给我们看一下你的代码,也许这只是一个小错误。你可能想看看MATLAB曲线拟合工具箱。到目前为止你尝试了什么?请给我们看看你的代码,也许只是个小错误。