参考文档
- 深度学习目标检测从入门到精通:第一篇
 - 使用SSD进行目标检测:目标检测第二篇
 - https://zhuanlan.zhihu.com/p/24954433 SSD架构理解
 - https://www.zhihu.com/question/58200555 smooth L1和L2的区别
 
目标检测模型的输出为:
边界框坐标(xyhw)
类概率(包含一个表示背景的附加标签,因为图像中的许多位置不对应任何对象)
default box/anchor(默认框/锚框):
分类网络输出中直接表示的框称为默认框/锚框,默认框的位置和大小取决于网络结构
基础概念
- Bounding box proposal:提交边界框
 - Intersection over Union:重叠联合比,又称 IoU,Jaccard 相似度
 - Non Maxium Suppression:非最大抑制
 - 边界框回归:边界框微调
 - ground truth box:真实边界框
 - ground true category:真实类别
 - (Default)Prior box:默认框、锚定框
 - 框匹配策略
 - 负样本挖掘
 
Default box
数据增广
目标函数
SSD的目标函数和其他常见的Object Detection方法相同,分成两个部分:
- 目标类别置信度,采用Softmax Loss(即交叉熵)
 - 位置回归,采用Smooth L1 Loss