Python 语义对象检测?

Python 语义对象检测?,python,cntk,Python,Cntk,这就是Kitti格式,数字使用的格式。这里记录了这一点: 从这里的示例来看:似乎我需要堆叠反序列化程序来实现目标。好的,这对于每个图像一个对象类来说是很好的,但是对于一个每个图像有很多对象或者一组已知对象的实例呢 我认为有必要采用类似Kitti的格式。目前是否存在这种情况?有没有一种方法可以堆叠反序列化程序来实现这一点?由于目前使用的是回归示例,我将无法跨多个边界框输出创建一组共享的特征提取器(原因不仅仅是标签,这里只关注标签) 问题很可能会出现,为什么我不使用快速RCNN演示?因为它使用ROI

这就是Kitti格式,数字使用的格式。这里记录了这一点:

从这里的示例来看:似乎我需要堆叠反序列化程序来实现目标。好的,这对于每个图像一个对象类来说是很好的,但是对于一个每个图像有很多对象或者一组已知对象的实例呢

我认为有必要采用类似Kitti的格式。目前是否存在这种情况?有没有一种方法可以堆叠反序列化程序来实现这一点?由于目前使用的是回归示例,我将无法跨多个边界框输出创建一组共享的特征提取器(原因不仅仅是标签,这里只关注标签)

问题很可能会出现,为什么我不使用快速RCNN演示?因为它使用ROI,并且ROI被发送用于分类,所以问题是我的对象类会根据它们在图像中的位置和周围的语义而变化。然后,Fast RCNN将框合并在一起作为主预测。这不适用于我的场景

谢谢

编辑-关于前进的思考 也许我只需要一个文本反序列化器

|文件1路径节点1节点2节点3节点4

|文件2路径节点1节点2节点3节点4

现在的问题是,如果每个文件中都有n个对象,该怎么办?Fast R-CNN有这种复杂的场景。它是否只是为每个类(如下面所示)在前4个节点之后堆叠下4个节点

|文件1路径x1 y1 x2 y2 x21 y21 x22 y22

现在如果我这么做了,那么问题是,读者如何知道这是哪个文件

我想文件名会变成序列Id吗

文件路径1 |苹果x1 y1 x2 y2 x21 y21 x22 y22 |香蕉x1 y1 x2 y2

文件路径2 |橙色x1 y1 x2 y2 x21 y21 x22 y22 |香蕉x1 y1 x2 y2


我认为上面的内容正是我所需要的,那么我想问题是,python中有这样一种格式的示例读取器吗?快速的R-CNN目前只出现在大脑脚本中。我想我可能能做的是将整个输入卷积特征图输入到ROI提案中,这将为我想要的任何东西生成一个语义对象检测网络。

你能想到与中显示的数据类似的数据吗,其中一些标签可以稀疏编码,例如苹果、香蕉和橙子。并非所有的文件路径都具有这三个属性。建议您参考本教程以获取见解