news 2026/4/23 12:29:16

数据结构入门:哈希表和树结构

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
数据结构入门:哈希表和树结构

一、排序 + 二分查找:基于有序结构的高效查找

1.1. 基本流程

对于无序数据集,先通过排序将其转化为有序结构,再利用二分查找实现高效查询:

排序阶段:采用时间复杂度为 O(nlogn) 的算法(如快速排序、归并排序),将数据集调整为有序序列。

查找阶段:二分查找通过 “分治” 思想,每次排除一半数据,时间复杂度为 O(logn)。

1.2. 示例

以数据集[5,7,4,2,0,3,1,6]为例:

  1. 排序后得到有序序列[0,1,2,3,4,5,6,7]
  2. 查找元素4
    • 初始区间[0,7],中间元素为3(小于 4),缩小到右区间[4,7]
    • 中间元素为5(大于 4),缩小到左区间[4,4],找到目标元素。

1.3. 局限性

排序操作的开销较高,若数据集频繁增删,需重复排序,整体效率下降。

二、哈希表:O (1) 级别的存储与查找

2.1. 核心原理

哈希表通过哈希函数将数据映射到数组的指定索引(即 “桶”),实现直接访问:

哈希函数:常见实现为value % 数组长度(需保证数组长度为质数以减少冲突);

理想情况下,插入、查找、删除操作的时间复杂度均为 O(1)。

2.2. 哈希冲突及解决

当不同数据映射到同一索引时,会发生 “哈希冲突”,常用拉链法解决:将冲突元素以链表 / 树的形式存储在同一桶下。

2.3. 示例

以数组长度为 10 的哈希表存储数据42,33,5,96

42%10=2 → 存入索引 2;

33%10=3 → 存入索引 3;

若存入9(9%10=9),后续存入19时发生冲突,将19链入索引 9 的链表中。

三、树结构:动态数据的高效分层存储

当数据量较大且需频繁增删时,树结构通过分层组织数据,平衡存储与查询效率。

3.1. 二叉排序树(BST)

3.1.1.定义

二叉排序树满足:左子树所有节点值 < 父节点值 < 右子树所有节点值。

3.1.2.操作复杂度

理想情况下(树结构平衡),插入、查找、删除的时间复杂度为 O(logn);

若数据有序,BST 会退化为单链表,操作复杂度劣化为 O(n)。

3.1.3.示例

存储数据集[5,3,1,4,8,9,7]的 BST 结构:

5 / \ 3 8 / \ / \ 1 4 7 9

3.2. 平衡二叉树(AVL 树)

为解决 BST 的退化问题,AVL 树通过平衡因子(左右子树高度差的绝对值)限制树的形态:

平衡因子需 ≤ 1;

当插入 / 删除导致失衡时,通过旋转操作调整结构:

LL/RR 旋转:单方向失衡时,将中间节点提升为父节点;

LR/RL 旋转:双向失衡时,先调整子树方向,再执行单旋转。

AVL 树的操作复杂度稳定为 O(logn),但旋转操作开销较高。

3.3. 红黑树

红黑树通过颜色规则维持近似平衡,降低调整频率:

  1. 红黑树的节点颜色不是红色就是黑色的;
  2. 根节点与叶子节点都为黑色;
  3. 如果一个节点是红色的,那么他的子节点必为黑色;
  4. 从根节点出发到任意一个叶子节点,所走过的路径上黑色节点的数目是相同的

红黑树的最长路径不超过最短路径的 2 倍,操作复杂度为 O(logn),是工程中常用的高效结构(如 Java 的TreeMapHashMap)。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/21 18:32:46

Qwen-Image与CLIP融合实现精准图文匹配

让AI真正“读懂”你的每一句话&#xff1a;Qwen-Image与CLIP融合下的图文匹配新范式 你有没有试过这样一条提示词&#xff1a;“穿着汉服的程序员在故宫敲代码&#xff0c;屏幕上滚动着Python脚本&#xff0c;窗外烟花绽放写着‘2025’”。点击生成后&#xff0c;画面确实古风十…

作者头像 李华
网站建设 2026/4/23 12:10:21

Markdown语法详解:为你的TensorFlow技术博客排版加分

Markdown 与 TensorFlow&#xff1a;如何用简洁排版释放深度学习表达力 在 AI 开发者的日常中&#xff0c;有一个场景几乎无人不晓&#xff1a;你终于调通了一个复杂的模型&#xff0c;训练准确率突破了预期&#xff0c;满心欢喜地准备把成果写成博客分享出去——结果打开编辑器…

作者头像 李华
网站建设 2026/4/23 12:10:34

基于C语言的学习---变量、常量、输入

一、如何输入&#xff1f;二、变量1、变量理解变量名字 price 可以随便取&#xff1b;变量就是放数据的地方&#xff1b;2、变量定义3、变量的名字4、C语言的关键字下面这些词是不能用来做变量名字的&#xff1b;三、变量的赋值和初始化1、赋值2、初始化如果没有初始化&#xf…

作者头像 李华
网站建设 2026/4/18 22:25:30

YOLOv5训练日志分析:Loss曲线怎么看?

YOLOv5训练日志分析&#xff1a;Loss曲线怎么看&#xff1f; 在实际目标检测项目的开发过程中&#xff0c;模型跑完第一个epoch后&#xff0c;开发者最关心的问题往往是&#xff1a;“这模型到底有没有在学&#xff1f;” 准确率还没上来&#xff0c;mAP还在爬升&#xff0c;但…

作者头像 李华
网站建设 2026/4/23 12:10:48

LobeChat能否召开虚拟会议?远程协作新模式

LobeChat能否召开虚拟会议&#xff1f;远程协作新模式 在远程办公日益普及的今天&#xff0c;团队每天被各种音视频会议填满&#xff1a;晨会、评审会、复盘会……时间碎片化严重&#xff0c;真正能专注做事的时间越来越少。有没有一种方式&#xff0c;既能保证信息同步和决策质…

作者头像 李华