Computer vision 模型什么时候发散?下一步是什么

Computer vision 模型什么时候发散?下一步是什么,computer-vision,object-detection,resnet,Computer Vision,Object Detection,Resnet,我用的是detectron2和级联rcnn。 我预测有4个不同的班级。数据集包含约6000个对象框和培训。 我使用resnet 50作为主干,获得了大约80的准确度。 然后我用resnet 101 back bone进行了尝试,在第一次迭代中出现了分歧 1. small dataset and big model easily diverged at the first iteration? 2. what heppen to small dataset and big back bone 3.

我用的是detectron2和级联rcnn。 我预测有4个不同的班级。数据集包含约6000个对象框和培训。 我使用resnet 50作为主干,获得了大约80的准确度。 然后我用resnet 101 back bone进行了尝试,在第一次迭代中出现了分歧

1. small dataset and big model easily diverged at the first iteration?
2. what heppen to small dataset and big back bone
3. And for my case augmentation + resnet50 backbone decrease the result why?
4. How should I fix this diverged problem?(what is the step next)
正如我们在Cascade R-CNN中看到的,他们预先训练的模型只使用ResNet50作为主干(和)

因此,模型偏离的最可能原因是,大多数参数需要从头开始训练(这要困难得多,需要更多数据),因为没有预先训练过的ResNet101

还请注意,使用较大型号会增加过度装配的风险