Machine learning KERA中的RGB图像是否表示为[R，G，B]，[R，G，B]。。。或者是[RR..GG..BB..]？_Machine Learning_Keras_Deep Learning_Computer Vision_Rgb

Machine learning KERA中的RGB图像是否表示为[R，G，B]，[R，G，B]。。。或者是[RR..GG..BB..]？

machine-learning keras deep-learning computer-vision

Machine learning KERA中的RGB图像是否表示为[R，G，B]，[R，G，B]。。。或者是[RR..GG..BB..]？,machine-learning,keras,deep-learning,computer-vision,rgb,Machine Learning,Keras,Deep Learning,Computer Vision,Rgb,假设我们有一个3x3 RGB图像以下哪种表述是正确的 [ R, G, B], [ R, R, R], [ R, G, B], OR [ G, G, G], [ R, G, B] [ B, B, B] 我故意省略了外括号，因为它们的设置方式是我问题答案的一部分在Keras（和大多数其他地方），“R”、“G”和“B”被称为“通道”。默认情况下，通道是张量的最后一个维度。这意味着每个图像是一个行数组，每行是一个像素数

假设我们有一个3x3 RGB图像

以下哪种表述是正确的

[ R, G, B],               [ R, R, R],
[ R, G, B],     OR        [ G, G, G], 
[ R, G, B]                [ B, B, B]

我故意省略了外括号，因为它们的设置方式是我问题答案的一部分

在Keras（和大多数其他地方），“R”、“G”和“B”被称为“通道”。默认情况下，通道是张量的最后一个维度。这意味着每个图像是一个行数组，每行是一个像素数组，每个像素是一个3种颜色/通道的数组。为了回答您的确切问题，您的第一个示例（而不是第二个示例）最能体现这一点

但是，KERA也可以配置为首先使用

通道

，这意味着相反。在这种情况下，图像是由3个通道组成的阵列，每个通道都是由像素组成的单色2D阵列。

从我的角度来看，您提出了一个不清楚的问题：

3x3 RGB图像通常表示为3x3x3阵列

这意味着，如果您的问题是关于3x3 RGB图像的，则该图像应包含三个3x3数组，每个数组包含一种颜色的值，可以可视化为：

{[(R, R, R),   [(G, G, G),   [(B, B, B),
  (R, R, R),    (G, G, G),    (B, B, B),
  (R, R, R)],   (G, G, G)],   (B, B, B)]}

您的问题实际上是3x1 RGB图像的可视化

在这种情况下（3x1 RGB图像），您问题中的这个版本应该是正确的（可能在换位之后）：

如果我错了，请随时编辑或更正我的答案

我只是自己发现的。它似乎是第一个选项：[R，G，B]，[R，G，B]，。。。谢谢你来参加我的Ted演讲！；-）

{[ R, R, R],
 [ G, G, G], 
 [ B, B, B]}