news 2026/6/10 19:43:13

1F1B详细原理流程(使用LLM生成的,但是讲解的挺生动的)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
1F1B详细原理流程(使用LLM生成的,但是讲解的挺生动的)
GPipe vs. 1F1B 流水线并行策略时序对比 太棒了,画图是理解并行策略最高效的方式! 为了让你一眼看懂,我为你绘制了一张**时序对比图(Time Schedule)**。 我们设定一个简单的场景: * **3 个工人**(GPU 0, GPU 1, GPU 2) * **4 个零件**(Micro-batch 1, 2, 3, 4) 请看下面的“草图”对比: ### 1. 😭 朴素模式 (GPipe):大片空白,效率低 > **特点**:一根筋。所有人必须先把所有零件的**初加工(F)** 做完,再统一做**精加工(B)**。 ```text 时间轴 (Time) ---> [T1] [T2] [T3] [T4] [T5] [T6] [T7] [T8] [T9] [T10] [T11] [T12] --------------------------------------------------------------------- GPU 0 | F1 | F2 | F3 | F4 | | | | | B1 | B2 | B3 | B4 | GPU 1 | | F1 | F2 | F3 | F4 | | | B1 | B2 | B3 | B4 | | GPU 2 | | | F1 | F2 | F3 | F4 | B1 | B2 | B3 | B4 | | | --------------------------------------------------------------------- ^^^^^^^^^^^^^^^ 注意中间这块巨大的空白(气泡) GPU0 和 GPU1 都在发呆!
  • F: Forward (前向计算)
  • B: Backward (反向传播)
  • 空白: 气泡 (Bubble),显卡在闲置烧钱。

2. 🤩 1F1B 模式:紧凑穿插,效率高

特点:灵活插单。只要下游把“修改意见(B)”传回来,我就立刻处理,处理完马上接着做下一个新零件(F)。

时间轴 (Time) ---> [T1] [T2] [T3] [T4] [T5] [T6] [T7] [T8] --------------------------------------------- GPU 0 | F1 | F2 | F3 | B1 | F4 | B2 | B3 | B4 | GPU 1 | | F1 | F2 | B1 | F3 | B2 | F4 | B3 | ... GPU 2 | | | F1 | B1 | F2 | B2 | F3 | B3 | ... --------------------------------------------- ^^^^^^^^^^ 看这里!(F) 和 (B) 完美交错

图解划重点:

  1. 热身 (Warm-up)

    • 看 GPU 0 的前三步F1 -> F2 -> F3。这是为了先把流水线填满。此时下游还没有反馈回来,所以只能闷头做 Forward。
  2. 1F1B 稳定期 (Steady State)

    • 看 GPU 0 的T4T5
      • T4 (B1):收到了下游传回来的第 1 个零件的梯度,立刻处理 B1(释放显存!)。
      • T5 (F4):处理完旧的,马上做新的 F4
    • 这就是“One Forward, One Backward”
  3. 消灭气泡

    • 对比两张图的长度,1F1B 明显更短(假如所有任务做完)。
    • 中间几乎没有连续的空白,显卡始终处于忙碌状态。
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/10 17:10:45

Habitat-Matterport 3D数据集完整配置与实战指南

Habitat-Matterport 3D数据集完整配置与实战指南 【免费下载链接】habitat-matterport3d-dataset This repository contains code to reproduce experimental results from our HM3D paper in NeurIPS 2021. 项目地址: https://gitcode.com/gh_mirrors/ha/habitat-matterport…

作者头像 李华
网站建设 2026/6/10 13:50:09

Java守护线程:JVM的幕后英雄,还是随时可牺牲的“工具人”?

文章目录1 守护线程的本质:JVM的“保姆”还是“备胎”?2 守护线程的创建与核心特性:如何与守护线程“打交道”2.1 创建守护线程的正确姿势2.2 守护线程的核心特性:卑微的“服务生”3 实战应用场景:守护线程在真实世界中…

作者头像 李华
网站建设 2026/6/10 17:08:07

终极指南:如何快速免费导出飞书文档到本地电脑

终极指南:如何快速免费导出飞书文档到本地电脑 【免费下载链接】feishu-doc-export 项目地址: https://gitcode.com/gh_mirrors/fe/feishu-doc-export 还在为迁移飞书文档而烦恼吗?feishu-doc-export 开源工具帮你解决所有痛点,只需简…

作者头像 李华
网站建设 2026/6/10 17:30:00

3分钟掌握:如何用FastExcel实现Java Excel处理10倍性能提升

3分钟掌握:如何用FastExcel实现Java Excel处理10倍性能提升 【免费下载链接】fastexcel Generate and read big Excel files quickly 项目地址: https://gitcode.com/gh_mirrors/fas/fastexcel 在Java应用开发中,Excel文件的读写操作是数据处理和…

作者头像 李华
网站建设 2026/6/10 13:37:32

vue基于Spring Boot的 水果草莓采摘园基地预约管理系统_2tb6x8l7

目录具体实现截图项目介绍论文大纲核心代码部分展示项目运行指导结论源码获取详细视频演示 :文章底部获取博主联系方式!同行可合作具体实现截图 本系统(程序源码数据库调试部署讲解)同时还支持java、ThinkPHP、Node.js、Spring B…

作者头像 李华
网站建设 2026/6/9 21:51:50

Linux系统如何安装哔哩哔哩客户端?完整解决方案指南

Linux系统如何安装哔哩哔哩客户端?完整解决方案指南 【免费下载链接】bilibili-linux 基于哔哩哔哩官方客户端移植的Linux版本 支持漫游 项目地址: https://gitcode.com/gh_mirrors/bi/bilibili-linux 想在Linux系统上畅享哔哩哔哩的精彩内容吗?本…

作者头像 李华