无人机追不上 “走走停停” 的目标？这篇顶刊研究给出 65% 性能突破方案-深圳市維司達科技有限公司

点击蓝字

关注我们

关注并星标

从此不迷路

计算机视觉研究院

公众号ID｜计算机视觉研究院

学习群｜扫码在主页获取加入方式

https://pmc.ncbi.nlm.nih.gov/articles/PMC12368023/pdf/41598_2025_Article_13698.pdf

计算机视觉研究院专栏

Column of Computer Vision Institute

针对无人机跟踪启停与不规则运动目标，提出一套自适应混合跟踪框架，相比传统卡尔曼滤波实现65% 性能提升，为实战化无人机跟踪提供了可落地的算法方案。

PART/1

痛点

行业痛点：无人机跟踪到底难在哪？

传统无人机跟踪算法大多基于匀速 / 匀加速假设，遇到真实场景里的 “奇葩运动” 直接失效。

核心挑战集中在这几类：

目标突然启停，速度瞬间跳变，滤波直接滞后
急转弯、变速、抖动
，轨迹高度非线性
遮挡、消失后再出现，跟踪断链难找回
小目标、低画质、复杂背景，容易误检跟丢
无人机自身在动，视角与尺度持续变化

【不同目标运动模式的跟踪挑战汇总】

这些问题叠加，导致常规跟踪在真实场景里准确率低、鲁棒性差、恢复慢。

PART/2

核心突破

核心突破：四大创新，把 “跟不住” 变成 “稳得住”

研究团队没有推翻传统算法，而是做自适应 + hybrid 混合，用数学与工程化创新解决断点问题。

1. 基于新息的运动模型切换

用新息协方差分析做置信度判决，自动在静止 / 匀速 / 匀加速 / 机动间切换
运动状态检测准确率89.3%，启停过渡几乎无卡顿
解决传统固定模型一遇突变就飘的问题

2. 带加加速度补偿的 α-β-γ-δ 自适应滤波

全球首个四参数滤波用于无人机航拍跟踪
新增 jerk（加加速度）补偿，专门啃 “急起急停” 硬骨头
不规则运动跟踪性能提升 15%–25%

3. 3D→2D 不确定性传播（SMART-TRACK）

把 3D 预测不确定性投影到 2D 图像，生成椭圆搜索区
遮挡 / 丢失后平均 2.3 秒恢复，传统方法需 5.8 秒
大幅提升断链重捕能力

4. 光流引导边际损失，解决 “运动长尾问题”

现有数据集平滑运动多、剧烈运动少，模型偏科
用 motion-weighted loss 强化大运动样本
大运动跟踪提升 18.7%

【关键数学创新与性能增益汇总】

PART/3

实验

实测结果：谁最好用？数据直接说话

团队在VisDrone2019、UAVDT、MOT17、DanceTrack四大权威数据集上做了全面对比，覆盖常规、启停、极度不规则运动。

1. 精度指标（越高越好）

混合方案SMART-TRACK：HOTA56.1%，MOTA93.1%
传统卡尔曼滤波：HOTA47.8%，MOTA88.2%
相对提升超 65%

【各算法跟踪精度定量结果（IoU、中心误差、HOTA、MOTA、IDF1）】

2. 抗恶劣环境能力

在雨、雾、噪声、模糊等 18 种污染下：

先进算法平均保持 52.3%精度
传统方法仅34.1%环境干扰下各算法精度对比

3. 恢复速度

遮挡 / 停止后重捕：

SMART-TRACK：2.3 秒
传统方法：5.8 秒遮挡 / 停止后跟踪误差随时间恢复曲线

PART/4

落地建议

落地建议：不同场景该选什么算法？

研究给出非常实用的选型指南，直接照抄可用：

算力有限的小型无人机选：OC-SORT理由：30+ FPS，内存 < 1GB，兼顾效率与启停适应性
高空小目标、快速移动目标选：SFTrack理由：低置信度启动、外观匹配强，小目标表现顶尖
极度不规则轨迹（舞蹈、狂奔、无规则运动）选：Flow-guided Margin Loss理由：专治大运动、长尾分布问题
遮挡多、频繁丢目标选：SMART-TRACK理由：3D→2D 不确定性投影，重捕最快最稳
通用全能型选：UAVMOT+AMF理由：各种运动都稳，综合评分最高

【各算法在不同运动场景的评分（0–10 分）】

PART/4

总结

这套研究的价值，不在于堆高精尖模型，而在于用数学与工程化手段，补齐传统跟踪的短板，让无人机在真实混乱场景里也能 “盯得紧、丢得少、找得快”。

未来方向也很清晰：

自监督自适应，不用大量标注数据
多机协同跟踪，解决遮挡与视角盲区
端侧轻量化，把高精度算法塞进小无人机
更均衡的数据集，解决运动长尾与场景偏见

对无人机安防、交通监测、应急救援等领域来说，这是一套可直接工程化的技术方案，值得行业快速落地。

有相关需求的你可以联系我们！

END

转载请联系本公众号获得授权

计算机视觉研究院学习群等你加入！

ABOUT

计算机视觉研究院

计算机视觉研究院主要涉及深度学习领域，主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。研究院每日分享最新的论文算法新框架，提供论文一键下载，并分享实战项目。研究院主要着重”技术研究“和“实践落地”。研究院会针对不同领域分享实践过程，让大家真正体会摆脱理论的真实场景，培养爱动手编程爱动脑思考的习惯！

往期推荐

🔗