- Published on
有向边界框 (OBB)
OBB 是 Oriented Bounding Box 的缩写,中文叫有向边界框或旋转边界框。
与普通检测框的区别
| 类型 | 英文 | 形状 | 输出参数 | 适用场景 |
|---|---|---|---|---|
| 普通检测框 | HBB (Horizontal Bounding Box) | 轴对齐矩形(不能旋转) | [x, y, w, h] | 直立物体(人、车、手机) |
| 有向检测框 | OBB (Oriented Bounding Box) | 可旋转的矩形 | [x, y, w, h, angle] | 倾斜物体(飞机、船舶、文本) |
简单理解
- 普通框:就像照相机拍的正方形相框,不管物体是歪的还是斜的,框永远正着放
- 旋转框:框可以跟着物体一起旋转,紧紧贴合物体的实际角度
举例说明
| 场景 | HBB(普通框) | OBB(旋转框) |
|---|---|---|
| 航拍飞机 | 框里包含大量天空背景,多个飞机框会重叠 | 框紧贴飞机机身,互不干扰 |
| 倾斜文本 | 框里混入上下行文字 | 框恰好贴合文字行角度 |
| 停车场车辆 | 斜停车位上的车框很大 | 车框跟着车头方向旋转,更精准 |
输出格式
OBB 模型输出通常为:
[
[x_center, y_center, width, height, angle, confidence, class_id],
[560, 320, 45, 28, 0.78, 0.95, 0], # angle 单位弧度
]
典型应用
- 遥感图像分析(飞机、船舶、油罐)
- 场景文本检测(OCR 前处理)
- 工业零件定位(散乱摆放的工件)
- 仓库货架扫描(倾斜的条码/货物)
一句话:OBB 就是能旋转的检测框,专门处理倾斜物体的精准定位。
THE END