Machine learning KERA中的RGB图像是否表示为[R,G,B],[R,G,B]。。。或者是[RR..GG..BB..]?
假设我们有一个3x3 RGB图像 以下哪种表述是正确的Machine learning KERA中的RGB图像是否表示为[R,G,B],[R,G,B]。。。或者是[RR..GG..BB..]?,machine-learning,keras,deep-learning,computer-vision,rgb,Machine Learning,Keras,Deep Learning,Computer Vision,Rgb,假设我们有一个3x3 RGB图像 以下哪种表述是正确的 [ R, G, B], [ R, R, R], [ R, G, B], OR [ G, G, G], [ R, G, B] [ B, B, B] 我故意省略了外括号,因为它们的设置方式是我问题答案的一部分在Keras(和大多数其他地方),“R”、“G”和“B”被称为“通道”。默认情况下,通道是张量的最后一个维度。这意味着每个图像是一个行数组,每行是一个像素数
[ R, G, B], [ R, R, R],
[ R, G, B], OR [ G, G, G],
[ R, G, B] [ B, B, B]
我故意省略了外括号,因为它们的设置方式是我问题答案的一部分在Keras(和大多数其他地方),“R”、“G”和“B”被称为“通道”。默认情况下,通道是张量的最后一个维度。这意味着每个图像是一个行数组,每行是一个像素数组,每个像素是一个3种颜色/通道的数组。为了回答您的确切问题,您的第一个示例(而不是第二个示例)最能体现这一点
但是,KERA也可以配置为首先使用
通道
,这意味着相反。在这种情况下,图像是由3个通道组成的阵列,每个通道都是由像素组成的单色2D阵列。从我的角度来看,您提出了一个不清楚的问题:
- 3x3 RGB图像通常表示为3x3x3阵列
{[(R, R, R), [(G, G, G), [(B, B, B),
(R, R, R), (G, G, G), (B, B, B),
(R, R, R)], (G, G, G)], (B, B, B)]}
- 您的问题实际上是3x1 RGB图像的可视化
如果我错了,请随时编辑或更正我的答案 我只是自己发现的。它似乎是第一个选项:[R,G,B],[R,G,B],。。。谢谢你来参加我的Ted演讲!;-)
{[ R, R, R],
[ G, G, G],
[ B, B, B]}