news 2026/6/26 3:14:43

深入剖析Java内存模型与volatile关键字

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
深入剖析Java内存模型与volatile关键字

计算机在运行程序时,每条指令都是在CPU中执行的,在执行过程中会涉及到数据的读写。我们知道程序运行的数据是存储在主存中,这时就会有一个问题,读写主存中的数据没有 CPU 中执行指令的速度快,如果任何的交互都需要与主存打交道则会大大降低效率,所以就有了 CPU寄存器、各级缓存、主存构成了一个速度与容量的平衡金字塔。

有了 CPU 高速缓存虽然解决了效率问题,但是它会带来一个新的问题:数据一致性。

缓存一致性问题的本质
在程序运行中,会将运行所需要的数据复制一份到 CPU 高速缓存中,在进行运算时 CPU 不再和主存打交道,而是直接从高速缓存中读写数据,只有当运行结束后,才会将数据刷新到主存中。

举一个简单的例子:

i = i + 1;

当线程运行这段代码时,首先会从主存中读取 i 的值( 假设此时 i = 1 ),然后复制一份到 CPU 高速缓存中,然后 CPU 执行 + 1 的操作(此时 i = 2),然后将数据 i = 2 写入到高速缓存中,最后刷新到主存中。

其实这样做在单线程中是没有问题的,有问题的是在多线程中。如下:

假如有两个线程 A、B 都执行这个操作( i++ ),两个线程从主存中读取 i 的值( 假设此时 i = 1 ),到各自的高速缓存中,然后线程 A 执行 +1 操作并将结果写入高速缓存中,最后写入主存中,此时主存 i = 2 。线程B做同样的操作,主存中的 i 仍然 = 2 。

让我们通过一个时序图来理解问题所在:

线程A 线程B 主存 │ │ i=1 ├─读取i───┐ │ │ │ │ │ │ │ 得到i=1 │ │ │ │ │ │ │ │ 计算i+1=2 │ │ │ │ ├─读取i─┐ │ │ 写入缓存 │ │ │ │ │ │ │ 得到i=1 │ │ │ 刷新到主存 │ │ │ │ │ │ 计算i+1=2 │ │ 主存i=2←───────────────→│ │ │ │ │ 写入缓存 │ │ │ │ 刷新到主存 │ │ │ 主存i=2←─→ │ │ │

最终结果:i=2,而非期望的3。这就是经典的缓存一致性问题。

解决缓存一致性方案有两种:

  • 通过在总线加 LOCK# 锁的方式
  • 通过缓存一致性协议(MESI 协议)
解决方案实现机制优点缺点用场景
总线加锁通过LOCK#信号锁住总线实现简单性能差,串行化早期处理器
MESI协议缓存行状态机管理性能好,部分并行实现复杂现代处理器

MESI协议核心状态:

  • Modified:缓存行被修改,与主存不一致
  • Exclusive:缓存行独占,与主存一致
  • Shared:缓存行被多个CPU共享
  • Invalid:缓存行无效,需重新加载

方案分析:

  • 第一种方案存在一个问题,它是采用一种独占的方式来实现的,即总线加 LOCK# 锁的话,只能有一个 CPU 能够运行,其他 CPU 都得阻塞,效率较为低下。
  • 第二种方案,缓存一致性协议(MESI 协议),它确保每个缓存中使用的共享变量的副本是一致的。

Java内存模型(JMM)

上面从操作系统层次阐述了如何保证数据一致性,下面我们来看一下 Java 内存模型,稍微研究一下它为我们提供了哪些保证,以及在 Java 中提供了哪些方法和机制,来让我们在进行多线程编程时能够保证程序执行的正确性。

在Java中,所有的实例、静态变量和数组元素都存储在堆内存中,堆内存在线程之间是共享的。局部变量,方法定义参数和异常数量参数是存放在Java虚拟机栈上面的。Java虚拟机栈是线程私有的因此不会在线程之间共享,它们不存在内存可见性的问题,也不受内存模型的影响。

Java内存模型(Java Memory Model 简称 JMM),决定一个一个线程对共享变量的写入何时对其它线程可见。JMM定义了线程和主内存之间的抽象关系:线程之间共享变量存储在主内存中,每个线程都有一个私有的本地内存,本地内存中存储了该线程共享变量的副本。本地内存是JMM的一个抽象概率,并不真实的存在。它涵盖了缓存,写缓存区,寄存器以及其他的硬件和编译优化。

Java内存模型的抽象概念图如下所示:


看完了Java内存模型的概念,我们再来看看内存模型中主内存是如何和线程本地内存之间交互的。

JMM定义了8个原子操作规范主内存与工作内存的交互:

┌───────────────────┐ ┌───────────────────┐ │ 主内存操作 │ │ 本地内存操作 │ ├───────────────────┤ ├───────────────────┤ │ 1. lock (锁定) │ │ 4. load (载入) │ │ 2. unlock (解锁) │←--→│ 5. use (使用) │ │ 3. read (读取) │ │ 6. assign (赋值) │ │ 8. write (写入) │ │ 7. store (存储) │ └───────────────────┘ └───────────────────┘

主内存和本地内存间的交互:
主内存和本地内存的交互即一个变量是如何从主内存中拷贝到本地内存又是如何从本地内存中回写到主内存中的实现,Java内存模型提供了8中操作来完成主内存和本地内存之间的交互。它们分别如下:

  • lock(锁定):作用于主内存的变量,它把一个变量标识为一条线程独占的状态。
  • unlock(解锁):作用于主内存的变量,它把一个处于锁定状态的变量释放出来,释放后的变量才能被其它线程锁定。
  • read(读取):作用于主内存的变量,它把一个变量从主内存传输到线程的本地内存中,以便随后的load动作使用。
  • load(载入):作用于本地内存的变量,它把read操作从主内存中的到的变量值放入本地内存的变量副本中。
  • use(使用):作用于本地内存的变量,它把本地内存中一个变量的值传递给执行引擎,每当虚拟机遇到一个需要使用到变量值的字节码指令时将会执行这个操作。
  • assign(赋值):作用于本地内存的变量,它把一个从执行引擎接收到的变量赋予给本地内存的变量,每当虚拟机遇到一个给变量赋值的字节码指令时将会执行这个操作。
  • store(存储):作用于本地内存的变量,它把本地内存中的变量的值传递给主内存中,以便后面的write操作使用。
  • write(写入):作用于主内存的变量,它把store操作从本地内存中得到的变量的值放入主内存的变量中。

从上面8种操作中,我们可以看出,当一个变量从主内存复制到线程的本地内存中时,需要顺序的执行read和load操作,当一个变量从本地内存同步到主内存中时,需要顺序的执行store和write操作。Java内存模型只要求上述的2组操作是顺序的执行的,但并不要求连续执行。比如对主内存中的变量a 和 b 进行访问时,有可能出现的顺序是read a read b load b load a。除此之外,Java内存模型还规定了在执行上述8种基本操作时必须满足以下规则:

  • read/load 和 store/write 必须成对出现
  • 不允许一个线程丢弃它最近的assign操作。即变量在线程的本地内存中改变后必须同步到主内存中。
  • 不允许一个线程无原因的把数据从线程的本地内存同步到主内存中。
  • 不允许线程的本地内存中使用一个未被初始化的变量。
  • 一个变量在同一时刻只允许一个线程对其进行lock操作,但是一个线程可以对一个变量进行多次的lock操作,当线程对同一变量进行了多次lock操作后需要进行同样次数的unlock操作才能将变量释放。
  • 如果一个变量执行了lock操作,则会清空本地内存中变量的拷贝,当需要使用这个变量时需要重新执行read和load操作。
  • 如果一个变量没有执行lock操作,那么就不能对这个变量执行unlock操作,同样也不允许unlock一个被其它线程执行了lock操作的变量。也就是说lock 和unlock操作是成对出现的并且是在同一个线程中。
  • 对一个变量执行unlock操作之前,必须将这个变量的值同步到主内存中去。

内存屏障

内存屏障(Memory Barrier,或有时叫做内存栅栏,Memory Fence)是一种CPU指令,用于控制特定条件下的重排序和内存可见性问题。Java编译器也会根据内存屏障的规则禁止重排序。

内存屏障可以被分为以下几种类型

  • LoadLoad屏障:对于这样的语句Load1; LoadLoad; Load2,在Load2及后续读取操作要读取的数据被访问前,保证Load1要读取的数据被读取完毕。
  • StoreStore屏障:对于这样的语句Store1; StoreStore; Store2,在Store2及后续写入操作执行前,保证Store1的写入操作对其它处理器可见。
  • LoadStore屏障:对于这样的语句Load1; LoadStore; Store2,在Store2及后续写入操作被刷出前,保证Load1要读取的数据被读取完毕。
  • StoreLoad屏障:对于这样的语句Store1; StoreLoad; Load2,在Load2及后续所有读取操作执行前,保证Store1的写入对所有处理器可见。它的开销是四种屏障中最大的。在大多数处理器的实现中,这个屏障是个万能屏障,兼具其它三种内存屏障的功能。

volatile

volatile的三大特性:

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/26 3:08:39

MoE模型推理优化:动态调度与缓存管理实践

1. 混合专家模型(MoE)推理的现状与挑战 混合专家模型(Mixture-of-Experts, MoE)已经成为扩展大语言模型(LLM)的主流架构之一。与传统的密集模型不同,MoE模型通过稀疏激活机制,在推理…

作者头像 李华
网站建设 2026/6/26 3:04:06

边缘AI部署实战

边缘AI部署实战:让智能触手可及 在人工智能技术快速发展的今天,边缘AI正成为行业焦点。与云端AI不同,边缘AI将计算能力下沉至设备端,实现低延迟、高隐私和实时响应。无论是工业质检、智能家居还是自动驾驶,边缘AI的部…

作者头像 李华
网站建设 2026/6/26 3:02:33

从靶机实战到权限提升:Lord of the Root渗透测试全流程解析

1. 项目概述:从靶机到实战的渗透测试演练场最近在渗透测试的实战演练和技能提升圈子里,一个名为“Lord of the Root”的靶机项目热度一直不减。这可不是什么新出的奇幻电影,而是一个被设计成“夺旗”(CTF)风格的虚拟机…

作者头像 李华
网站建设 2026/6/26 2:57:27

Go语言的map并发安全与sync.Map在读多写少场景下的性能对比

Go语言中map的并发安全与sync.Map在读多写少场景下的性能对比 在Go语言开发中,map作为常用的数据结构,其原生实现并不支持并发安全操作。在高并发场景下,若不加锁直接操作map,可能导致数据竞争甚至程序崩溃。而标准库提供的sync.…

作者头像 李华
网站建设 2026/6/26 2:50:20

梦幻魔法公主下载2026最新

下载链接 解析《梦幻魔法公主》的架构设计与核心机制:基于有限状态机的数值养成系统 在独立游戏开发和模拟养成(Simulation Game)领域,如何通过底层代码逻辑有机连接复杂的数值系统、叙事文本和图形渲染,一直是评判一…

作者头像 李华
网站建设 2026/6/26 2:50:13

许嵩、徐佳莹背后音乐集团IPO,百度、腾讯音乐、淡马锡等投资

2026年6月22日,华语独立音乐龙头太合音乐集团正式向港交所主板递交招股说明书,这也是太合音乐成立以来首次冲击IPO。作为覆盖音乐全产业链的本土音乐服务商,太合音乐打通词曲版权、艺人经纪演出、票务服务完整商业闭环,横跨实体唱…

作者头像 李华