点击蓝字
关注我们
关注并星标
从此不迷路
计算机视觉研究院
公众号ID|计算机视觉研究院
学习群|扫码在主页获取加入方式
https://pmc.ncbi.nlm.nih.gov/articles/PMC12368023/pdf/41598_2025_Article_13698.pdf
计算机视觉研究院专栏
Column of Computer Vision Institute
针对无人机跟踪启停与不规则运动目标,提出一套自适应混合跟踪框架,相比传统卡尔曼滤波实现65% 性能提升,为实战化无人机跟踪提供了可落地的算法方案。
PART/1
痛点
行业痛点:无人机跟踪到底难在哪?
传统无人机跟踪算法大多基于匀速 / 匀加速假设,遇到真实场景里的 “奇葩运动” 直接失效。
核心挑战集中在这几类:
目标突然启停,速度瞬间跳变,滤波直接滞后
- 急转弯、变速、抖动
,轨迹高度非线性
遮挡、消失后再出现,跟踪断链难找回
小目标、低画质、复杂背景,容易误检跟丢
无人机自身在动,视角与尺度持续变化
【不同目标运动模式的跟踪挑战汇总】
这些问题叠加,导致常规跟踪在真实场景里准确率低、鲁棒性差、恢复慢。
PART/2
核心突破
核心突破:四大创新,把 “跟不住” 变成 “稳得住”
研究团队没有推翻传统算法,而是做自适应 + hybrid 混合,用数学与工程化创新解决断点问题。
1. 基于新息的运动模型切换
用新息协方差分析做置信度判决,自动在静止 / 匀速 / 匀加速 / 机动间切换
运动状态检测准确率89.3%,启停过渡几乎无卡顿
解决传统固定模型一遇突变就飘的问题
2. 带加加速度补偿的 α-β-γ-δ 自适应滤波
全球首个四参数滤波用于无人机航拍跟踪
新增 jerk(加加速度)补偿,专门啃 “急起急停” 硬骨头
不规则运动跟踪性能提升 15%–25%
3. 3D→2D 不确定性传播(SMART-TRACK)
把 3D 预测不确定性投影到 2D 图像,生成椭圆搜索区
遮挡 / 丢失后平均 2.3 秒恢复,传统方法需 5.8 秒
大幅提升断链重捕能力
4. 光流引导边际损失,解决 “运动长尾问题”
现有数据集平滑运动多、剧烈运动少,模型偏科
用 motion-weighted loss 强化大运动样本
大运动跟踪提升 18.7%
【关键数学创新与性能增益汇总】
PART/3
实验
实测结果:谁最好用?数据直接说话
团队在VisDrone2019、UAVDT、MOT17、DanceTrack四大权威数据集上做了全面对比,覆盖常规、启停、极度不规则运动。
1. 精度指标(越高越好)
混合方案SMART-TRACK:HOTA56.1%,MOTA93.1%
传统卡尔曼滤波:HOTA47.8%,MOTA88.2%
相对提升超 65%
【各算法跟踪精度定量结果(IoU、中心误差、HOTA、MOTA、IDF1)】
2. 抗恶劣环境能力
在雨、雾、噪声、模糊等 18 种污染下:
先进算法平均保持 52.3%精度
传统方法仅34.1%环境干扰下各算法精度对比
3. 恢复速度
遮挡 / 停止后重捕:
SMART-TRACK:2.3 秒
传统方法:5.8 秒遮挡 / 停止后跟踪误差随时间恢复曲线
PART/4
落地建议
落地建议:不同场景该选什么算法?
研究给出非常实用的选型指南,直接照抄可用:
算力有限的小型无人机选:OC-SORT理由:30+ FPS,内存 < 1GB,兼顾效率与启停适应性
高空小目标、快速移动目标选:SFTrack理由:低置信度启动、外观匹配强,小目标表现顶尖
极度不规则轨迹(舞蹈、狂奔、无规则运动)选:Flow-guided Margin Loss理由:专治大运动、长尾分布问题
遮挡多、频繁丢目标选:SMART-TRACK理由:3D→2D 不确定性投影,重捕最快最稳
通用全能型选:UAVMOT+AMF理由:各种运动都稳,综合评分最高
【各算法在不同运动场景的评分(0–10 分)】
PART/4
总结
这套研究的价值,不在于堆高精尖模型,而在于用数学与工程化手段,补齐传统跟踪的短板,让无人机在真实混乱场景里也能 “盯得紧、丢得少、找得快”。
未来方向也很清晰:
自监督自适应,不用大量标注数据
多机协同跟踪,解决遮挡与视角盲区
端侧轻量化,把高精度算法塞进小无人机
更均衡的数据集,解决运动长尾与场景偏见
对无人机安防、交通监测、应急救援等领域来说,这是一套可直接工程化的技术方案,值得行业快速落地。
有相关需求的你可以联系我们!
END
转载请联系本公众号获得授权
计算机视觉研究院学习群等你加入!
ABOUT
计算机视觉研究院
计算机视觉研究院主要涉及深度学习领域,主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。研究院每日分享最新的论文算法新框架,提供论文一键下载,并分享实战项目。研究院主要着重”技术研究“和“实践落地”。研究院会针对不同领域分享实践过程,让大家真正体会摆脱理论的真实场景,培养爱动手编程爱动脑思考的习惯!
往期推荐
🔗
YOLO-TLA:一种基于 YOLOv5 的高效轻量级小目标检测模型
ViT-YOLO:基于Transformer的用于目标检测的YOLO算法
SSMA-YOLO:一种轻量级的 YOLO 模型,具备增强的特征提取与融合能力,适用于无人机航拍的船舶图像检测
LUD-YOLO:一种用于无人机的新型轻量级目标检测网络
Gold-YOLO:基于聚合与分配机制的高效目标检测器
Drone-YOLO:一种有效的无人机图像目标检测
「无人机+AI」“空中城管”
无人机+AI:光伏巡检自动化解决方案
无人机视角下多类别船舶检测及数量统计
机场项目:解决飞行物空间大小/纵横比、速度、遮挡等问题引起的实时目标检测问题
2PCNet:昼夜无监督域自适应目标检测(附原代码)
YOLO-S:小目标检测的轻量级、精确的类YOLO网络
大改Yolo框架 | 能源消耗极低的目标检测新框架(附论文下载)
改进的检测算法:用于高分辨率光学遥感图像目标检测