参考文档

  1. 深度学习目标检测从入门到精通:第一篇
  2. 使用SSD进行目标检测:目标检测第二篇
  3. https://zhuanlan.zhihu.com/p/24954433 SSD架构理解
  4. https://www.zhihu.com/question/58200555 smooth L1和L2的区别

目标检测模型的输出为:

  1. 边界框坐标(xyhw)

  2. 类概率(包含一个表示背景的附加标签,因为图像中的许多位置不对应任何对象)

default box/anchor(默认框/锚框):

分类网络输出中直接表示的框称为默认框/锚框,默认框的位置和大小取决于网络结构

基础概念

  1. Bounding box proposal:提交边界框
  2. Intersection over Union:重叠联合比,又称 IoU,Jaccard 相似度
  3. Non Maxium Suppression:非最大抑制
  4. 边界框回归:边界框微调
  5. ground truth box:真实边界框
  6. ground true category:真实类别
  7. (Default)Prior box:默认框、锚定框
  8. 框匹配策略
  9. 负样本挖掘

Default box

数据增广

目标函数

SSD的目标函数和其他常见的Object Detection方法相同,分成两个部分:

  • 目标类别置信度,采用Softmax Loss(即交叉熵)
  • 位置回归,采用Smooth L1 Loss

results matching ""

    No results matching ""