Machine learning 机器学习中维度、属性和特征的区别

Machine learning 机器学习中维度、属性和特征的区别,machine-learning,Machine Learning,这是二维的:[[2,2]],但它也有两个特性/属性,不是吗。我对维度、属性和特征之间的区别感到困惑。它们是相同的东西。属性、维度和特征。根据作者的背景或领域,它们可以互换使用 例如,如果你在谈论数学方面,你可以说这是一个高维问题 我不同意@Atilla的回答 维度通常指属性的数量,虽然它也可以以“数据向量的第二维度是人的年龄”的形式使用,但它相当罕见-在大多数情况下,维度是“属性的数量” 属性是点中一种特定的“数据类型”,因此每个观察/数据点(如个人记录)包含许多不同的属性(如人的体重、身高、

这是二维的:[[2,2]],但它也有两个特性/属性,不是吗。我对维度、属性和特征之间的区别感到困惑。

它们是相同的东西。属性、维度和特征。根据作者的背景或领域,它们可以互换使用


例如,如果你在谈论数学方面,你可以说这是一个高维问题

我不同意@Atilla的回答

  • 维度通常指属性的数量,虽然它也可以以“数据向量的第二维度是人的年龄”的形式使用,但它相当罕见-在大多数情况下,维度是“属性的数量”
  • 属性是点中一种特定的“数据类型”,因此每个观察/数据点(如个人记录)包含许多不同的属性(如人的体重、身高、年龄等)
  • 功能根据上下文可能有多种含义:
    • 它有时指属性
    • 它有时指由特定学习模型生成的数据的内部表示,例如,神经网络提取属性或其他特征的组合
    • 它有时指由核方法(在核PCA、核k-均值、SVM中)产生的数据的假设表示
通常,您有一些对象X,您使用一些属性(这是特征提取的第一步,因此这些属性有时也被称为特征)来描述这些对象X,它们创建给定维度的表示(属性数、提取的特征)。然后你训练一些模型,它通常会创建某种抽象(有时甚至是多层次的),每一种抽象都会生成新的特征(从特征中提取特征),这些特征比较低“层次”上的更复杂


f通常是反复出现的,因此
f2(repr(X))
实际上是一些
f2'(f1(repr(X))

这个问题似乎离题了,因为它属于stats.stackexchange.com。其中的一个例外是内核方法,其中特征空间表示方法隐式工作的非线性转换空间。不幸的是,即使在这里,术语也被拼凑在一起,这对初学者来说相当混乱。更正式一点ly:第14页和第15页。因此,特征工程是所有ML方法的第一步?(有监督和无监督)该答案没有提到特征工程注意,在神经网络的上下文中,术语“中间特征”有时用于与为训练提供的“特征”(属性)进行对比
 X  --->   repr(X)   --->   f1(repr(X)) --->   ....  --->   fn(repr(X))
data      attributes         1st level                      nth level
        (0th features)       features                       features

      |repr(X)|=dimension