文章目录
- 摘要
- 1 引言
- 2 光流问题的数学基础
- 2.1 光流基本方程与孔径问题
- 2.2 问题的数学本质
- 3 传统光流算法
- 3.1 变分法:Horn-Schunck算法
- 3.2 局部微分法:Lucas-Kanade算法
- 3.3 其他传统方法及性能对比
- 4 基于深度学习的光流算法
- 4.1 范式转换:从手工设计到端到端学习
- 4.2 奠基之作:FlowNet与FlowNet 2.0
- 4.3 经典框架:PWC-Net
- 4.4 范式革新:RAFT及其影响
- 5 最新研究进展(2025-2026)
- 5.1 退化感知光流:扩散模型的引入
- 5.2 事件相机光流:超越传统帧率极限
- 5.3 面向鲁棒性的基准与框架
- 6 数据集与评估方法
- 6.1 主流光流数据集
- 6.2 新兴基准与评估趋势
- 6.3 评价指标体系
- 7 应用场景
- 8 挑战与展望
- 9 结语
- 参考文献
- 发表于2026年4月18日,四川
摘要
光流估计作为计算机视觉领域的基础性底层任务,通过计算连续帧间像素的位移场为高级视觉理解提供关键的运动信息。本文系统梳理了光流算法从经典变分方法到深度学习范式的发展脉络,重点分析了以Horn-Schunck和Lucas-Kanade为代表的传统方法的理论基础与局限性,以及以FlowNet、PWC-Net和RAFT为里程碑的深度学习方法的演进逻辑。研究表明,深度学习通过端到端特征学习和迭代优化机制,在Sintel、KITTI等主流基准上实现了相对于传统方法30%以上的精度提升,但仍在运动模糊、大位移、遮挡和真实世界退化等场景中面临严峻挑战。近年来,基于扩散模型的退化感知光流、事件相机光流等新范式正在重新定义这一领域的研究边界。本文进一步梳理了光流评估体系与主流数据集,总结了自动驾驶、视频分析、流体测量等典型应用场景,并对未来发展方向进行了展望。
关键词:光流估计;深度学习;RAFT;事件相机;计算机视觉
1 引言
光流(Optical Flow)描述了三维空间中的物体运动在二维图像平面上的投影,是理解动态场景中“什么在运动”以及“如何运动”的核心视觉信息。Gibson于1950年首次提出了光流的概念框架,但直到1981年Horn和Schunck提出第一个可计算密集光流场的变分框架后,这一理论才真正走向实用。
光流计算之所以重要,在于它为大量中高层视觉任务提供了不可替代的底层输入:在运动分割中,光流是区分前景运动物体与静态背景的关键依据;在三维重建中,光流携带了恢复场景深度结构的几何约束;在目标跟踪和动作识别中,光流提供