Computer vision 如何规范化uint16深度图像以进行训练?

Computer vision 如何规范化uint16深度图像以进行训练?,computer-vision,pytorch,Computer Vision,Pytorch,从ScanNet数据集渲染的深度图像位于uint16,深度除以移位(1000)后,深度值在[0,1

从ScanNet数据集渲染的深度图像位于
uint16
,深度除以移位(1000)后,深度值在
[0,1<一些正浮点值<10]
的范围内,如何将深度标准化为
[0,1]
,以便进行培训?(每个数据集标准化)

  • 在训练集中计算
    平均值
    标准值
    ,但我得到的
    平均值
    标准值
    分别为
    1.6515和
    0.9373
    ,这显然无法在
    [0,1]
    [-1,1]
    中规范化深度
  • 迭代训练集以找到
    max\u depth
    min\u depth=0
    并使用
    (depth-min\u depth)/(max\u depth-min\u depth)
    ,训练集中的
    max\u depth
    大于测试集中的值

  • 第二个有意义吗?或者有什么方法吗?

    只需找到最大深度值并除以它即可。为了避免这种情况,您可以简单地除以10。