Machine learning 在机器学习中,图像中的特征是什么?

Machine learning 在机器学习中,图像中的特征是什么?,machine-learning,Machine Learning,我有点理解什么是特征,比如说学习垃圾邮件的ML算法,某些关键词可能是特征 但是在著名的MNIST数字数据集中,我看到一个数字矩阵,整个矩阵是一个单一的特征吗?还是矩阵中每个数字都有一个特征?在我看来,您缺少一些批判性的文献综述。 以下是一些关于RNN和CNN的好文章,可用于图像识别应用: 什么是功能?特征表示输入向量的一个元素,用于训练模型并生成输出 功能集取决于应用程序。 输入向量的每个元素都是不同的(依赖或独立)特征 查看本教程,例如使用MNIST数字数据集: 它说: ''' 使用递归

我有点理解什么是特征,比如说学习垃圾邮件的ML算法,某些关键词可能是特征


但是在著名的MNIST数字数据集中,我看到一个数字矩阵,整个矩阵是一个单一的特征吗?还是矩阵中每个数字都有一个特征?

在我看来,您缺少一些批判性的文献综述。 以下是一些关于RNN和CNN的好文章,可用于图像识别应用:

什么是功能?特征表示输入向量的一个元素,用于训练模型并生成输出

功能集取决于应用程序。
输入向量的每个元素都是不同的(依赖或独立)特征

查看本教程,例如使用MNIST数字数据集:

它说: ''' 使用递归神经网络对图像进行分类,我们考虑每个图像。 行作为像素序列。因为MNIST图像形状是28*28px,所以我们将 为每个样本处理28个步骤的28个序列。 '''

RNN是基于序列构建的,因此,如果图像是28乘28,则可以将其分解为28个特征的28个序列

# Network Parameters
num_input = 28 # MNIST data input (img shape: 28*28)
timesteps = 28 # timesteps
这是您在网络参数中看到的。28个功能部件(num_input=28)表示图像的一个序列


为了再次重复,输入向量的每个元素都被视为一个特征。此外,分析员有责任正确定义这些特性。

在我看来,您缺乏一些批判性的文献综述。
# Network Parameters
num_input = 28 # MNIST data input (img shape: 28*28)
timesteps = 28 # timesteps
以下是一些关于RNN和CNN的好文章,可用于图像识别应用:

什么是功能?特征表示输入向量的一个元素,用于训练模型并生成输出

功能集取决于应用程序。
输入向量的每个元素都是不同的(依赖或独立)特征

查看本教程,例如使用MNIST数字数据集:

它说: ''' 使用递归神经网络对图像进行分类,我们考虑每个图像。 行作为像素序列。因为MNIST图像形状是28*28px,所以我们将 为每个样本处理28个步骤的28个序列。 '''

RNN是基于序列构建的,因此,如果图像是28乘28,则可以将其分解为28个特征的28个序列

# Network Parameters
num_input = 28 # MNIST data input (img shape: 28*28)
timesteps = 28 # timesteps
这是您在网络参数中看到的。28个功能部件(num_input=28)表示图像的一个序列


为了再次重复,输入向量的每个元素都被视为一个特征。此外,分析员有责任正确定义这些特征。

从技术上讲,特征是一个数值,它区别地表示(或试图区别地表示)输入或输入的某些部分。在MNIST的情况下,图像大小为28 x 28,整个图像矩阵被展平(通常按行)为1D特征向量,该特征向量的每个元素都是特征(在这种情况下,仅为图像强度)。想要使用的功能的类型或种类是完全特定于问题的。例如,您可以使用白色像素数作为特征,而不是整平整个MNIST数字图像;然而,它可以归结为这样一个特性对于给定问题的识别能力

# Network Parameters
num_input = 28 # MNIST data input (img shape: 28*28)
timesteps = 28 # timesteps
在垃圾邮件分类的情况下,通常特征是单词的频率(还有其他一些事情,如停止词消除、词干提取等)

可以为给定的问题选择或设计多个特征,例如笔划长度、曲率、边数等,您在上面的评论中提到了这些。然而,其主要思想是特征对于所有类都应该具有足够的区分性,并且它们不应该相互派生(这一点将我们引向另一个称为特征或降维的问题)。我建议你先阅读这个维基百科页面,然后再阅读一篇关于特征提取和降维的学术报告,比如(这篇是针对图像的)。这将有助于您理解总体思路


另一个注意事项是,这些特征被组合成一种称为特征向量的紧凑表示形式。在这种特殊情况下,如前所述,您有一个一维特征向量,其中包含图像强度作为特征

从技术上讲,特征是一个数值,它区别性地表示(或试图区别性地表示)输入或输入的某些部分。在MNIST的情况下,图像大小为28 x 28,整个图像矩阵被展平(通常按行)为1D特征向量,该特征向量的每个元素都是特征(在这种情况下,仅为图像强度)。想要使用的功能的类型或种类是完全特定于问题的。例如,您可以使用白色像素数作为特征,而不是整平整个MNIST数字图像;然而,它可以归结为这样一个特性对于给定问题的识别能力

在垃圾邮件分类的情况下,通常特征是单词的频率(还有其他一些事情,如停止词消除、词干提取等)

可以为给定的问题选择或设计多个特征,例如笔划长度、曲率、边数等,您在上面的评论中提到了这些。然而,其主要思想是特征对于所有类都应该具有足够的区分性,并且它们不应该相互派生(这一点将我们引向另一个称为特征或降维的问题)。我建议你先阅读这个维基百科页面,然后再阅读一篇关于特征提取和降维的学术报告,比如(这篇是针对图像的)。这将有助于您理解总体思路

a