news 2026/6/10 15:30:11

百亿级 Feed 流架构设计:微博/朋友圈的“推拉模式” (Push vs Pull) 到底该怎么选?

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
百亿级 Feed 流架构设计:微博/朋友圈的“推拉模式” (Push vs Pull) 到底该怎么选?

🌊 前言:发一条朋友圈,后台发生了什么?

你以为发朋友圈只是往数据库插了一条记录?
错!

对于微信朋友圈这种熟人社交(好友一般几百人),系统可能需要把你的动态“推送”给这几百人的信箱。
但对于微博这种媒体社交,如果**周杰伦(粉丝 5000 万)**发了一条状态,系统难道要瞬间插入 5000 万条数据到粉丝的信箱里吗?数据库会瞬间熔断,整个机房都会冒烟。

这就是 Feed 流系统设计最核心的难题:写扩散 (Write Fan-out) vs 读扩散 (Read Fan-out)。

今天,我们从架构视角,深挖百亿级 Feed 流的**“推拉之战”**。


🥊 模式一:推模式 (Push / 写扩散)

原理
也叫**“写扩散”。每个用户都有一个收件箱 (Inbox)**。
当用户 A 发布一条动态时,系统会遍历 A 的所有粉丝,把这条动态的 ID 插入到每一个粉丝的收件箱里。

场景
微信朋友圈。因为你的好友上限只有 5000,且大部分人好友不多,推模式的延迟极低。

架构图解:

粉丝收件箱 Inbox
触发
写入
写入
写入
读取
粉丝 B 的 Timeline
业务服务器
粉丝 C 的 Timeline
粉丝 D 的 Timeline
用户 A 发布动态
粉丝 B
  • 优点
    • 读操作极快:粉丝刷新 Feed 流时,不需要复杂的查询,直接读自己的 Inbox (Redis ZSet) 即可。
    • 高可用:某个用户的 Inbox 挂了,不影响其他人。
  • 缺点
    • 存储成本高:一份数据被复制了 N 份。
    • “大V”灾难:如果粉丝量达到千万级,发一条动态需要写千万次 Redis,会有巨大的同步延迟(粉丝可能几分钟后才刷到)。

🧲 模式二:拉模式 (Pull / 读扩散)

原理
也叫**“读扩散”。每个用户有一个发件箱 (Outbox)**。
用户 A 发布动态,只写自己的 Outbox。
当粉丝 B 刷新首页时,系统去查询 B 关注的所有人(A, C, D…)的 Outbox,把最新的动态拉取回来,在内存中进行排序聚合。

场景
早期的微博,或者关注人数很少的系统。

架构图解:

聚合查询 Aggregation
写入
写入
1. 获取关注列表
2. 并发拉取
2. 并发拉取
3. 内存排序
关注列表: A, C
粉丝 B 刷新首页
A 的发件箱
C 的发件箱
最终 Feed 流
用户 A 发布
用户 C 发布
  • 优点
    • 写操作极快:只写一条数据。
    • 节省空间:数据不冗余。
  • 缺点
    • 读操作极慢:如果你关注了 2000 个人,刷新一下首页需要查 2000 次数据库/缓存,然后排序。这对系统的QPS是毁灭性的打击。

⚖️ 终极方案:推拉结合 (Hybrid) —— 微博/抖音的选择

既然推模式怕大V,拉模式怕高并发读,那为什么不混合使用呢?

核心策略:
将用户划分为**“大V”“普通用户”,将粉丝划分为“活跃用户”“僵尸粉”**。

1. 针对“大V”(在线推,离线拉)

当周杰伦(大V)发布动态时:

  • 在线粉丝(Push):只将动态 ID 推送给当前在线最近活跃的粉丝的 Inbox。这样数据量可控。
  • 离线/所有粉丝(Pull):将动态写入周杰伦的 Outbox。当不活跃的粉丝上线时,再去拉取。
2. 针对“普通用户”(全量推)

当你的邻居(只有 200 粉丝)发布动态时:

  • 直接使用Push 模式,写扩散到这 200 个人的 Inbox。成本忽略不计。

Redis ZSet 实战代码片段:

// 推模式示例:给活跃粉丝推送 Feed IDpublicvoidpushFeedToActiveFollowers(LongfeedId,LongauthorId){// 1. 获取活跃粉丝列表 (BitMap 或 缓存)List<Long>activeFans=followerService.getActiveFollowers(authorId);// 2. 管道批量写入 Redis ZSetredisTemplate.executePipelined((RedisCallback<Object>)connection->{for(LongfanId:activeFans){Stringkey="inbox:"+fanId;// Score 使用时间戳,方便排序connection.zAdd(key.getBytes(),System.currentTimeMillis(),String.valueOf(feedId).getBytes());// 限制长度,只保留最近 1000 条connection.zRemRangeByRank(key.getBytes(),0,-(1000+1));}returnnull;});}

💾 存储选型:海量数据存哪里?

光有逻辑不行,数据存哪里也是关键。

  1. Feed ID 列表(关系数据)
    • Redis ZSet:性能最好,适合存 Timeline 的 ID 列表。
    • Tair / RocksDB:如果内存太贵,可以使用磁盘 KV 存储。
  2. Feed 内容(正文数据)
    • HBase / Cassandra:适合海量写入、通过 RowKey (FeedID) 查询的场景。
    • MySQL:分库分表也可以,但成本较高。

📝 总结

没有最好的架构,只有最适合业务场景的架构。

  • 朋友圈:好友少,直接用Push
  • 微博/Twitter:粉丝关系极度倾斜,必须用Push + Pull 结合
  • 企业级系统:如果是简单的站内信,Pull模式足够了。

下次面试官问你“怎么设计 Feed 流”,先把推拉结合甩在他脸上,然后细聊在线状态判断冷热数据分离

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/6 17:06:58

27、设计与实现 SNMP MIB:从基础到实践

设计与实现 SNMP MIB:从基础到实践 1. 设计 SNMP MIB 之报警表 报警表是 MIB 的核心部分,用于展示区域和报警状态。以下是在 MIB 中定义该表的详细信息: -- ----------------------------------------- -- LAD Alarm Table -- ----------------------------------------…

作者头像 李华
网站建设 2026/6/8 12:49:45

34、Linux 系统中帧缓冲设备驱动配置与数据库到文件实用工具详解

Linux 系统中帧缓冲设备驱动配置与数据库到文件实用工具详解 在 Linux 系统中,正确配置帧缓冲设备驱动以及合理使用数据库到文件的实用工具,对于系统的正常运行和高效管理至关重要。以下将详细介绍相关内容。 帧缓冲设备驱动配置 vesafb 驱动配置 驱动特性 :vesafb 驱动…

作者头像 李华
网站建设 2026/6/9 21:37:09

像素字体创作革命:Fusion Pixel Font 深度创作指南

像素字体创作革命&#xff1a;Fusion Pixel Font 深度创作指南 【免费下载链接】fusion-pixel-font 开源像素字体。支持 8、10 和 12 像素。 项目地址: https://gitcode.com/gh_mirrors/fu/fusion-pixel-font 在数字设计的世界中&#xff0c;像素字体正经历着一场真正的…

作者头像 李华
网站建设 2026/6/9 18:16:23

HoRain云--Java HTTP请求全攻略:从入门到精通

&#x1f3ac; HoRain 云小助手&#xff1a;个人主页 ⛺️生活的理想&#xff0c;就是为了理想的生活! ⛳️ 推荐 前些天发现了一个超棒的服务器购买网站&#xff0c;性价比超高&#xff0c;大内存超划算&#xff01;忍不住分享一下给大家。点击跳转到网站。 目录 ⛳️ 推荐 …

作者头像 李华
网站建设 2026/6/10 3:19:34

Access数据库引擎64位版本深度解析与实战指南

Access数据库引擎64位版本深度解析与实战指南 【免费下载链接】AccessDatabaseEngine_X64下载与安装指南 本仓库提供了一个名为 AccessDatabaseEngine_X64.zip 的资源文件&#xff0c;该文件用于解决在开发过程中遇到的“Microsoft.Jet.OLEDB.4.0”提供程序未在本地计算机上注册…

作者头像 李华