参考文档
- 深度学习目标检测从入门到精通:第一篇
- 使用SSD进行目标检测:目标检测第二篇
- https://zhuanlan.zhihu.com/p/24954433 SSD架构理解
- https://www.zhihu.com/question/58200555 smooth L1和L2的区别
目标检测模型的输出为:
边界框坐标(xyhw)
类概率(包含一个表示背景的附加标签,因为图像中的许多位置不对应任何对象)
default box/anchor(默认框/锚框):
分类网络输出中直接表示的框称为默认框/锚框,默认框的位置和大小取决于网络结构
基础概念
- Bounding box proposal:提交边界框
- Intersection over Union:重叠联合比,又称 IoU,Jaccard 相似度
- Non Maxium Suppression:非最大抑制
- 边界框回归:边界框微调
- ground truth box:真实边界框
- ground true category:真实类别
- (Default)Prior box:默认框、锚定框
- 框匹配策略
- 负样本挖掘
Default box
数据增广
目标函数
SSD的目标函数和其他常见的Object Detection方法相同,分成两个部分:
- 目标类别置信度,采用Softmax Loss(即交叉熵)
- 位置回归,采用Smooth L1 Loss