Tensorflow 深度学习模型中浮点16和8位量化的区别是什么

Tensorflow 深度学习模型中浮点16和8位量化的区别是什么,tensorflow,model,Tensorflow,Model,目前,我正在阅读这个网站来了解人脸检测模型。在本文中,它提到了浮点16和8位量化版本模型 我想问: 他们两个有什么不同 不同类型的DL模型的应用是什么?在哪种情况下我们需要使用 链接至网站: 他们两个有什么不同 如您所见,8位的模型尺寸小于FP16,这里的FP16和8位表示模型权重值的精度和类型 不同类型的DL模型的应用是什么?那么 我们需要使用什么 通常,高精度会使模型尺寸变大,但可能更精确,但是,在某些情况下,当我们需要以较小的延迟运行模型或在轻量级设备上运行模型时,我们可能希望减少模型尺

目前,我正在阅读这个网站来了解人脸检测模型。在本文中,它提到了浮点168位量化版本模型

我想问:

  • 他们两个有什么不同
  • 不同类型的DL模型的应用是什么?在哪种情况下我们需要使用
  • 链接至网站:

    • 他们两个有什么不同

      如您所见,8位的模型尺寸小于FP16,这里的FP16和8位表示模型权重值的精度和类型

    • 不同类型的DL模型的应用是什么?那么 我们需要使用什么

      通常,高精度会使模型尺寸变大,但可能更精确,但是,在某些情况下,当我们需要以较小的延迟运行模型或在轻量级设备上运行模型时,我们可能希望减少模型尺寸,但有时会稍微降低精度