Deep learning 在自动编码器、ward hierarchy clustering等之前标准化/规范化数据(二进制和#x2B;数字)。?

Deep learning 在自动编码器、ward hierarchy clustering等之前标准化/规范化数据(二进制和#x2B;数字)。?,deep-learning,cluster-analysis,normalization,hierarchy,standardized,Deep Learning,Cluster Analysis,Normalization,Hierarchy,Standardized,我有一个包含二进制数据(0,1)和不同单位的数字数据的数据集。如果我想应用一些机器学习技术对数据进行分类(可能是自动编码或层次聚类),我应该标准化或规范化数据吗 谢谢大家! 视情况而定 对于神经网络,出于数值原因,您可能需要标准化连续变量。但这取决于你的平台。考虑Google TPU:它们使用1字节的精度,所以你希望相关的输入域使用这个有限的范围。 对于基于距离的方法,如聚类,预处理数据是至关重要的,但很困难。标准化总是正确的做法,这是错误的。但应用一些规范化是相当常见的。但是,您需要一位领域专

我有一个包含二进制数据(0,1)和不同单位的数字数据的数据集。如果我想应用一些机器学习技术对数据进行分类(可能是自动编码或层次聚类),我应该标准化或规范化数据吗

谢谢大家!

视情况而定

对于神经网络,出于数值原因,您可能需要标准化连续变量。但这取决于你的平台。考虑Google TPU:它们使用1字节的精度,所以你希望相关的输入域使用这个有限的范围。 对于基于距离的方法,如聚类,预处理数据是至关重要的,但很困难。标准化总是正确的做法,这是错误的。但应用一些规范化是相当常见的。但是,您需要一位领域专家来找到最佳的规范化方法。

这取决于具体情况

对于神经网络,出于数值原因,您可能需要标准化连续变量。但这取决于你的平台。考虑Google TPU:它们使用1字节的精度,所以你希望相关的输入域使用这个有限的范围。 对于基于距离的方法,如聚类,预处理数据是至关重要的,但很困难。标准化总是正确的做法,这是错误的。但应用一些规范化是相当常见的。但是您需要领域专家来找到最佳规范化