Computer vision 使用K-均值聚类生成锚盒，YOLO_Computer Vision_K Means_Object Detection_Bounding Box_Yolo

Computer vision 使用K-均值聚类生成锚盒，YOLO

computer-vision

Computer vision 使用K-均值聚类生成锚盒，YOLO,computer-vision,k-means,object-detection,bounding-box,yolo,Computer Vision,K Means,Object Detection,Bounding Box,Yolo,我试图了解YOLO的工作原理，以及它是如何检测图像中的物体的。我的问题是，k-means聚类在检测对象周围的边界框时扮演什么角色？谢谢。K-均值聚类算法是数据科学中非常著名的算法。该算法旨在将n观测值划分为k簇。主要包括：初始化：K表示随机生成（即质心）分配：通过将每个观测值与最近的质心相关联形成聚类更新群集：新创建的群集的质心变为平均值赋值和更新重复发生，直到收敛。最终结果是，点与其各自质心之间的平方误差之和最小化编辑：为什么要使用K手段与其他无监督学习算法相比，K-means

我试图了解YOLO的工作原理，以及它是如何检测图像中的物体的。我的问题是，k-means聚类在检测对象周围的边界框时扮演什么角色？谢谢。

K-均值聚类算法是数据科学中非常著名的算法。该算法旨在将

观测值划分为

簇。主要包括：

初始化：

表示随机生成（即质心）

分配：通过将每个观测值与最近的质心相关联形成聚类

更新群集：新创建的群集的质心变为平均值

赋值和更新重复发生，直到收敛。最终结果是，点与其各自质心之间的平方误差之和最小化

编辑：

为什么要使用K手段

与其他无监督学习算法相比，K-means算法计算速度更快，效率更高。别忘了时间复杂性是线性的

它产生了比层次聚类更高的聚类。更多的集群有助于获得更准确的最终结果

实例可以在重新计算质心时更改群集（移动到另一个群集）

即使你的一些假设被打破了，也能很好地工作

它在确定锚箱时真正起到了什么作用

它将为表示形状、位置、大小等的每个预测值创建一系列锚箱（即k-均值聚类）

对于每个定位框，计算哪个对象的边界框具有最高的重叠除以非重叠。这称为联合或IOU上的交集

如果最高IOU大于50%（这可以自定义），请告诉锚定框它应该检测到具有最高IOU的对象

否则，如果IOU大于40%，则告诉神经网络，真实检测不明确，不要从该示例中学习

如果最高IOU小于40%，则应预测没有对象

谢谢

一般来说，对象的边界框由以下形式的元组给出（x0，y0，x1，y1），其中x0，y0是左下角的坐标，x1，y1是右上角的坐标

需要从这些坐标中提取宽度和高度，并根据图像宽度和高度规范化数据

K-均值的度量

欧几里德距离

借据（信用卡索引）

借据证明比以前好

Jaccard索引=（所选框和簇头框之间的交点）/（所选框和簇头框之间的并集）

在初始化时，我们可以选择k个随机框作为簇头。根据IoU值>阈值将锚定框分配给各个集群，并计算集群的平均IoU

这个过程可以重复，直到收敛。

我想这只是解释了IOU是如何工作的，而不是k-means在YOLO中是如何工作的？？嗨，谢谢你，我接受了你的答案，因为这是我一直在寻找的问题。