Machine learning KERA中的RGB图像是否表示为[R,G,B],[R,G,B]。。。或者是[RR..GG..BB..]?

Machine learning KERA中的RGB图像是否表示为[R,G,B],[R,G,B]。。。或者是[RR..GG..BB..]?,machine-learning,keras,deep-learning,computer-vision,rgb,Machine Learning,Keras,Deep Learning,Computer Vision,Rgb,假设我们有一个3x3 RGB图像 以下哪种表述是正确的 [ R, G, B], [ R, R, R], [ R, G, B], OR [ G, G, G], [ R, G, B] [ B, B, B] 我故意省略了外括号,因为它们的设置方式是我问题答案的一部分在Keras(和大多数其他地方),“R”、“G”和“B”被称为“通道”。默认情况下,通道是张量的最后一个维度。这意味着每个图像是一个行数组,每行是一个像素数

假设我们有一个3x3 RGB图像

以下哪种表述是正确的

[ R, G, B],               [ R, R, R],
[ R, G, B],     OR        [ G, G, G], 
[ R, G, B]                [ B, B, B]
我故意省略了外括号,因为它们的设置方式是我问题答案的一部分

在Keras(和大多数其他地方),“R”、“G”和“B”被称为“通道”。默认情况下,通道是张量的最后一个维度。这意味着每个图像是一个行数组,每行是一个像素数组,每个像素是一个3种颜色/通道的数组。为了回答您的确切问题,您的第一个示例(而不是第二个示例)最能体现这一点


但是,KERA也可以配置为首先使用
通道
,这意味着相反。在这种情况下,图像是由3个通道组成的阵列,每个通道都是由像素组成的单色2D阵列。

从我的角度来看,您提出了一个不清楚的问题:

  • 3x3 RGB图像通常表示为3x3x3阵列
这意味着,如果您的问题是关于3x3 RGB图像的,则该图像应包含三个3x3数组,每个数组包含一种颜色的值,可以可视化为:

{[(R, R, R),   [(G, G, G),   [(B, B, B),
  (R, R, R),    (G, G, G),    (B, B, B),
  (R, R, R)],   (G, G, G)],   (B, B, B)]}
  • 您的问题实际上是3x1 RGB图像的可视化
在这种情况下(3x1 RGB图像),您问题中的这个版本应该是正确的(可能在换位之后):


如果我错了,请随时编辑或更正我的答案

我只是自己发现的。它似乎是第一个选项:[R,G,B],[R,G,B],。。。谢谢你来参加我的Ted演讲!;-)
{[ R, R, R],
 [ G, G, G], 
 [ B, B, B]}