news 2026/5/17 1:25:02

算法学习记录18——并查集 vs Set + BFS/DFS

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
算法学习记录18——并查集 vs Set + BFS/DFS

写在前面:最近刷 LeetCode 遇到一道题(2092. Find All People With Secret),题目要求模拟“秘密”在专家之间的传播过程。我一开始想到用set+ BFS,后来又看到有人用并查集(Union-Find)解法。于是我就开始思考:这两种方法到底有什么区别?能不能互相替代?哪种更高效?这篇笔记就是我对这个问题的探索和总结,希望能帮到未来的自己,也欢迎你一起学习!


🧩 问题背景回顾

题目大意:

  • n个专家(编号 0 到 n-1)。
  • 专家 0 在时间 0 把秘密告诉了firstPerson
  • 之后,在一系列会议中(每个会议是[x, y, time]),如果其中一人知道秘密,另一人立刻也知道。
  • 同一时间点的多场会议可以“瞬时”传播秘密(即形成连通分量,只要有一人知道,整个连通块都知道)。
  • 问最终哪些专家知道秘密?

关键点:按时间分组处理,每组内做连通性传播


✅ 我的第一反应:用set+ BFS

思路

  1. 用一个set(比如叫known)记录当前知道秘密的人。
  2. 把所有会议按时间排序,相同时间的归为一组。
  3. 对每一组:
    • 构建无向图(邻接表)。
    • known中已知的人出发,BFS 遍历整个连通分量。
    • 把遍历到的所有人加入known

代码核心片段(简化版)

known={0,firstPerson}meetings.sort(key=lambdax:x[2])i=0whilei<len(meetings):# 收集同一时间的所有会议,建图graph=defaultdict(list)while同一时间:x,y=meeting graph[x].append(y)graph[y].append(x)i+=1# BFS:从 known 中已在图里的人出发queue=deque([pforpingraphifpinknown])visited=set(queue)whilequeue:cur=queue.popleft()fornbingraph[cur]:ifnbnotinvisited:visited.add(nb)queue.append(nb)known|=visited# 合并新知道秘密的人

优点

  • 逻辑直观:就像真的在“传播秘密”。
  • 自动剪枝:只遍历与已知者连通的部分,无关节点完全不碰。
  • 效率高:实测在 LeetCode 上跑得很快。

🔁 后来我尝试了并查集(Union-Find)

思路

  1. 同样按时间分组。
  2. 对每组会议:
    • 收集所有涉及的人。
    • 新建一个并查集(⚠️关键!不能复用之前的,否则会跨时间错误传播)。
    • 把每对会议参与者 union 起来。
    • 按根节点分组,检查每个连通分量是否包含known中的人。
    • 如果包含,就把整个分量加入known

注意事项

  • 必须为每个时间点单独建 UF!这是最容易出错的地方。
  • 即使某分量只有一个人知道秘密,也要把整个分量加进去。

代码片段(关键部分)

# 每个时间点新建 parent 字典parent={p:pforpinpeople_in_this_time}deffind(x):ifparent[x]!=x:parent[x]=find(parent[x])returnparent[x]forx,yinmeetings_at_this_time:union(x,y)# 分组groups=defaultdict(set)forpinpeople_in_this_time:groups[find(p)].add(p)# 检查哪些 group 有 known 的人forgroupingroups.values():ifany(pinknownforpingroup):known|=group

优缺点

  • ✅ 并查集操作快(近 O(1))。
  • ❌ 但要遍历所有参会者,即使他们和秘密无关。
  • ❌ 容易写错(比如忘记重置 UF)。

⚖️ 深入对比:Set+BFS vs 并查集

维度Set + BFS/DFS并查集(Union-Find)
适用场景离线、分批、需状态传播在线动态连通性、仅需判断连通
时间复杂度O(M log M + M)O(M log M + M α(N))
常数开销较小(只遍历相关部分)稍大(需初始化、分组)
剪枝能力✅ 强(从已知出发)❌ 弱(必须处理所有节点)
代码难度简单直观易错(UF 隔离问题)
能否获取路径✅ 可以❌ 不行
在线查询支持❌ 不支持✅ 支持

💡结论
对于本题这类“分阶段、状态传播”的问题,Set + BFS 更合适
但对于“边动态加入、频繁查询连通性”的问题(如 Kruskal 最小生成树),并查集不可替代


🤔 那么问题来了:所有并查集解法都能被 Set+BFS 替代吗?

答案是:不能。

✅ 可以替代的情况

  • 图是静态的离线分批构建的。
  • 你需要传播状态(如“知道秘密”)、过滤条件剪枝
  • 你关心连通块内部结构(比如谁传给谁)。

例如:LeetCode 2092、朋友圈、岛屿数量等。

❌ 难以替代的情况

  • 在线动态连通性:边一条条来,中间不断问“x 和 y 连通吗?”
    • BFS 每次都要重建图 + 遍历 → O(n+m) 每次,太慢。
    • 并查集每次 O(α(n)),快得多。
  • 只需要判断连通性,不需要遍历
    • 并查集内存更省,操作更快。
  • 高频合并集合
    • 如 Kruskal 算法,必须高效判断加边是否成环。

🧠 类比理解

  • 并查集≈ “户口本管理员”
    → 你问:“A 和 B 是一家人吗?”
    → 他秒查户口本告诉你“是”或“不是”,但不知道家里谁做饭、谁带娃。

  • BFS/DFS + set≈ “社区社工上门走访”
    → 你让他从 A 家出发,看看能串门到哪些人家。
    → 他不仅能告诉你连通性,还能记录路径、传播消息、收集需求。

所以:任务不同,工具不同


版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/11 13:56:08

14、环境诱导退相干:从基础理论到实际应用

环境诱导退相干:从基础理论到实际应用 在量子物理的研究中,环境诱导退相干是一个至关重要的概念,它对于理解量子系统与环境的相互作用以及量子 - 经典过渡具有关键意义。本文将深入探讨环境诱导退相干的几个重要方面,包括大距离下退相干速率的饱和、零温度下的退相干以及系…

作者头像 李华
网站建设 2026/5/13 4:52:31

22、基于光子的量子信息科学探索

基于光子的量子信息科学探索 量子隐形传态协议概述 量子隐形传态协议是量子信息科学中的重要内容。其过程可分解为以下几个关键步骤: 1. 辅助纠缠粒子对的分发 :准备一对辅助的纠缠粒子(如粒子 2 和 3)。 2. 贝尔态测量 :对粒子 1 和 2 进行贝尔态测量,也就是将其…

作者头像 李华
网站建设 2026/5/15 2:26:50

大厂量产的储能源代码(PCS)

大厂量产PCS储能源代码某大厂储能研发中心最近流传着一组被反复打磨的PCS控制代码。这套代码最有趣的地方在于其状态切换机制——用有限状态机把光伏并网、离网模式、故障恢复这些场景安排得明明白白。来看这个核心状态切换逻辑&#xff1a; class PCSStateMachine:def __init_…

作者头像 李华
网站建设 2026/5/10 4:39:20

Python+Vue的 融合多源高校画像数据与协同过滤算法的高考择校推荐系统Pycharm django flask

这里写目录标题项目介绍项目展示详细视频演示技术栈文章下方名片联系我即可~解决的思路开发技术介绍性能/安全/负载方面python语言Django框架介绍技术路线关键代码详细视频演示收藏关注不迷路&#xff01;&#xff01;需要的小伙伴可以发链接或者截图给我 项目介绍 本系统共有…

作者头像 李华
网站建设 2026/4/23 12:45:15

Open-AutoGLM如何实现丝滑触控?:3个关键步骤还原自然轨迹生成机制

第一章&#xff1a;Open-AutoGLM 触控轨迹自然度优化原理在移动设备与图形化交互日益紧密的背景下&#xff0c;触控输入的自然度成为影响用户体验的关键因素。Open-AutoGLM 通过深度建模用户手指运动轨迹的动态特征&#xff0c;实现对原始触控点序列的智能平滑与预测性修正&…

作者头像 李华