Machine learning 在机器学习中，图像中的特征是什么？_Machine Learning

Machine learning 在机器学习中，图像中的特征是什么？

machine-learning

Machine learning 在机器学习中，图像中的特征是什么？,machine-learning,Machine Learning,我有点理解什么是特征，比如说学习垃圾邮件的ML算法，某些关键词可能是特征但是在著名的MNIST数字数据集中，我看到一个数字矩阵，整个矩阵是一个单一的特征吗？还是矩阵中每个数字都有一个特征？在我看来，您缺少一些批判性的文献综述。以下是一些关于RNN和CNN的好文章，可用于图像识别应用：什么是功能？特征表示输入向量的一个元素，用于训练模型并生成输出功能集取决于应用程序。输入向量的每个元素都是不同的（依赖或独立）特征查看本教程，例如使用MNIST数字数据集：它说： ''' 使用递归

我有点理解什么是特征，比如说学习垃圾邮件的ML算法，某些关键词可能是特征

但是在著名的MNIST数字数据集中，我看到一个数字矩阵，整个矩阵是一个单一的特征吗？还是矩阵中每个数字都有一个特征？

在我看来，您缺少一些批判性的文献综述。以下是一些关于RNN和CNN的好文章，可用于图像识别应用：

什么是功能？特征表示输入向量的一个元素，用于训练模型并生成输出

功能集取决于应用程序。

输入向量的每个元素都是不同的（依赖或独立）特征

查看本教程，例如使用MNIST数字数据集：

它说： ''' 使用递归神经网络对图像进行分类，我们考虑每个图像。行作为像素序列。因为MNIST图像形状是28*28px，所以我们将为每个样本处理28个步骤的28个序列。 '''

RNN是基于序列构建的，因此，如果图像是28乘28，则可以将其分解为28个特征的28个序列

# Network Parameters
num_input = 28 # MNIST data input (img shape: 28*28)
timesteps = 28 # timesteps

这是您在网络参数中看到的。28个功能部件（num_input=28）表示图像的一个序列

为了再次重复，输入向量的每个元素都被视为一个特征。此外，分析员有责任正确定义这些特性。

在我看来，您缺乏一些批判性的文献综述。

# Network Parameters
num_input = 28 # MNIST data input (img shape: 28*28)
timesteps = 28 # timesteps

以下是一些关于RNN和CNN的好文章，可用于图像识别应用：

什么是功能？特征表示输入向量的一个元素，用于训练模型并生成输出

功能集取决于应用程序。

输入向量的每个元素都是不同的（依赖或独立）特征

查看本教程，例如使用MNIST数字数据集：

RNN是基于序列构建的，因此，如果图像是28乘28，则可以将其分解为28个特征的28个序列

# Network Parameters
num_input = 28 # MNIST data input (img shape: 28*28)
timesteps = 28 # timesteps

这是您在网络参数中看到的。28个功能部件（num_input=28）表示图像的一个序列

为了再次重复，输入向量的每个元素都被视为一个特征。此外，分析员有责任正确定义这些特征。

从技术上讲，特征是一个数值，它区别地表示（或试图区别地表示）输入或输入的某些部分。在MNIST的情况下，图像大小为28 x 28，整个图像矩阵被展平（通常按行）为1D特征向量，该特征向量的每个元素都是特征（在这种情况下，仅为图像强度）。想要使用的功能的类型或种类是完全特定于问题的。例如，您可以使用白色像素数作为特征，而不是整平整个MNIST数字图像；然而，它可以归结为这样一个特性对于给定问题的识别能力

# Network Parameters
num_input = 28 # MNIST data input (img shape: 28*28)
timesteps = 28 # timesteps

在垃圾邮件分类的情况下，通常特征是单词的频率（还有其他一些事情，如停止词消除、词干提取等）

可以为给定的问题选择或设计多个特征，例如笔划长度、曲率、边数等，您在上面的评论中提到了这些。然而，其主要思想是特征对于所有类都应该具有足够的区分性，并且它们不应该相互派生（这一点将我们引向另一个称为特征或降维的问题）。我建议你先阅读这个维基百科页面，然后再阅读一篇关于特征提取和降维的学术报告，比如（这篇是针对图像的）。这将有助于您理解总体思路

另一个注意事项是，这些特征被组合成一种称为特征向量的紧凑表示形式。在这种特殊情况下，如前所述，您有一个一维特征向量，其中包含图像强度作为特征

从技术上讲，特征是一个数值，它区别性地表示（或试图区别性地表示）输入或输入的某些部分。在MNIST的情况下，图像大小为28 x 28，整个图像矩阵被展平（通常按行）为1D特征向量，该特征向量的每个元素都是特征（在这种情况下，仅为图像强度）。想要使用的功能的类型或种类是完全特定于问题的。例如，您可以使用白色像素数作为特征，而不是整平整个MNIST数字图像；然而，它可以归结为这样一个特性对于给定问题的识别能力

在垃圾邮件分类的情况下，通常特征是单词的频率（还有其他一些事情，如停止词消除、词干提取等）