Computer vision 使用K-均值聚类生成锚盒,YOLO

Computer vision 使用K-均值聚类生成锚盒,YOLO,computer-vision,k-means,object-detection,bounding-box,yolo,Computer Vision,K Means,Object Detection,Bounding Box,Yolo,我试图了解YOLO的工作原理,以及它是如何检测图像中的物体的。我的问题是,k-means聚类在检测对象周围的边界框时扮演什么角色?谢谢。K-均值聚类算法是数据科学中非常著名的算法。该算法旨在将n观测值划分为k簇。主要包括: 初始化:K表示随机生成(即质心) 分配:通过将每个观测值与最近的质心相关联形成聚类 更新群集:新创建的群集的质心变为平均值 赋值和更新重复发生,直到收敛。 最终结果是,点与其各自质心之间的平方误差之和最小化 编辑: 为什么要使用K手段 与其他无监督学习算法相比,K-means

我试图了解YOLO的工作原理,以及它是如何检测图像中的物体的。我的问题是,k-means聚类在检测对象周围的边界框时扮演什么角色?谢谢。

K-均值聚类算法是数据科学中非常著名的算法。该算法旨在将
n
观测值划分为
k
簇。主要包括:

  • 初始化:
    K
    表示随机生成(即质心)
  • 分配:通过将每个观测值与最近的质心相关联形成聚类

  • 更新群集:新创建的群集的质心变为平均值

  • 赋值和更新重复发生,直到收敛。 最终结果是,点与其各自质心之间的平方误差之和最小化

    编辑:

    为什么要使用K手段

  • 与其他无监督学习算法相比,K-means算法计算速度更快,效率更高。别忘了时间复杂性是线性的
  • 它产生了比层次聚类更高的聚类。更多的集群有助于获得更准确的最终结果
  • 实例可以在重新计算质心时更改群集(移动到另一个群集)
  • 即使你的一些假设被打破了,也能很好地工作
  • 它在确定锚箱时真正起到了什么作用

  • 它将为表示形状、位置、大小等的每个预测值创建一系列锚箱(即k-均值聚类)
  • 对于每个定位框,计算哪个对象的边界框具有最高的重叠除以非重叠。这称为联合或IOU上的交集
  • 如果最高IOU大于50%(这可以自定义),请告诉锚定框它应该检测到具有最高IOU的对象
  • 否则,如果IOU大于40%,则告诉神经网络,真实检测不明确,不要从该示例中学习
  • 如果最高IOU小于40%,则应预测没有对象

  • 谢谢

    一般来说,对象的边界框由以下形式的元组给出 (x0,y0,x1,y1),其中x0,y0是左下角的坐标,x1,y1是右上角的坐标

    需要从这些坐标中提取宽度和高度,并根据图像宽度和高度规范化数据

    K-均值的度量

  • 欧几里德距离
  • 借据(信用卡索引)
  • 借据证明比以前好

    Jaccard索引=(所选框和簇头框之间的交点)/(所选框和簇头框之间的并集)

    在初始化时,我们可以选择k个随机框作为簇头。根据IoU值>阈值将锚定框分配给各个集群,并计算集群的平均IoU


    这个过程可以重复,直到收敛。

    我想这只是解释了IOU是如何工作的,而不是k-means在YOLO中是如何工作的??嗨,谢谢你,我接受了你的答案,因为这是我一直在寻找的问题。