Java并发编程系列之一并发理论基础

本系列文章开始Java并发编程的进阶篇的学习,为了初学者对多线程的初步使用有基本概念和掌握,前置知识会对一些基础篇的内容进行介绍,以使初学者能够丝滑入戏。

多线程学习,真正的难点不在于多线程程序的逻辑有多复杂,而在于理清J.U.C包中各个多线程工具类之间的关系、特点及其使用场景,学习应该是从整体到局部、高屋建瓴,这对学习任何知识都至关重要。

站在上帝视角,以全局视野,抽丝剥茧,深入每个并发编程的各个包及APi的底层实现。

概览

下图为并发编程包含的所有内容。读者大致浏览各个包及实现类,以做到心中有数。

image-20220330104116155

毫无疑问JUC是并发编程的核心内容,也是我们文章笔墨重点,我们来看JUC包下所有的内容。JUC即 java.util.concurrent

image-20220330103514768

首先我们对并发编程的理论基础进行介绍。

多线程引起的问题

使用多线程会引发并发问题,如果多个线程对同一个共享数据进行访问而不采取同步操作的话,那么操作的结果是不一致的。

如果张三、李四、王二哥仨代表三个线程,哥仨只有一个钱包,张三取完钱还没记到账上,李四把钱又取走了,这样导致了数据不一致问题。

这样的问题是怎么引发的呢?

出现的根源就是CPU、内存、I/O 设备的速度是有极大差异的,为了合理利用 CPU 的高性能,平衡这三者的速度差异,计算机体系结构、操作系统、编译程序都做出了贡献,主要体现为:

  • CPU 增加了缓存,以均衡与内存的速度差异;// 导致 可见性问题
  • 操作系统增加了进程、线程,以分时复用 CPU,进而均衡 CPU 与 I/O 设备的速度差异;// 导致 原子性问题
  • 编译程序优化指令执行次序,使得缓存能够得到更加合理地利用。// 导致 有序性问题

可见性、原子性、有序性即为并发三要素,张三取钱没有同步到账上,也就是可见性问题。

我们重点说一下有序性。

1
2
3
4
int i = 0;              
boolean flag = false;
i = 1; //语句1
flag = true; //语句2

上面代码定义了一个int型变量,定义了一个boolean类型变量,然后分别对两个变量进行赋值操作。

从代码顺序上看,语句1是在语句2前面的,那么JVM在真正执行这段代码的时候会保证语句1一定会在语句2前面执行吗?

不一定,为什么呢? 这里可能会发生指令重排序(Instruction Reorder)。

在执行程序时为了提高性能,编译器和处理器常常会对指令做重排序。重排序分三种类型:

  • 编译器优化的重排序。编译器在不改变单线程程序语义的前提下,可以重新安排语句的执行顺序。
  • 指令级并行的重排序。现代处理器采用了指令级并行技术(Instruction-Level Parallelism, ILP)来将多条指令重叠执行。如果不存在数据依赖性,处理器可以改变语句对应机器指令的执行顺序。
  • 内存系统的重排序。由于处理器使用缓存和读 / 写缓冲区,这使得加载和存储操作看上去可能是在乱序执行。

从 java 源代码到最终实际执行的指令序列,会分别经历下面三种重排序:

image-20220330111155750

1 属于编译器重排序,2 和 3 属于处理器重排序。

这些重排序都可能会导致多线程程序出现内存可见性问题。

对于编译器,Java内存模型的编译器重排序规则会禁止特定类型的编译器重排序(不是所有的编译器重排序都要禁止)。对于处理器重排序,JMM 的处理器重排序规则会要求 java 编译器在生成指令序列时,插入特定类型的内存屏障(memory barriers,intel 称之为 memory fence)指令,通过内存屏障指令来禁止特定类型的处理器重排序。

JAVA是怎么解决并发问题的

既然多线程存在这三个问题,那么java就需要解决这三个问题。

1、针对原子性,Java内存模型只保证了基本读取和赋值是原子性操作,如果要实现更大粒度的原子性,可以通过synchronized和Lock来实现。

2、针对可见性,Java提供了volatile关键字来保证可见性。当一个共享变量被volatile修饰时,它会保证修改的值会立即被更新到主存,当有其他线程需要读取时,它会去内存中读取新值。,通过synchronized和Lock也能够保证可见性,synchronized和Lock能保证同一时刻只有一个线程获取锁然后执行同步代码,并且在释放锁之前会将对变量的修改刷新到主存当中。

3、针对有序性,使用先行发生原则(happens-before),让一个操作无需控制就能先于另一个操作完成。

而JUC的出现本质上也是为了解决这些问题,当然,这是后话。

怎么避免并发问题呢?

不可变(Immutable)的对象一定是线程安全的,不需要再采取任何的线程安全保障措施。只要一个不可变的对象被正确地构建出来,永远也不会看到它在多个线程之中处于不一致的状态。

多线程环境下,应当尽量使对象成为不可变,来满足线程安全。

  • final 关键字修饰的基本数据类型
  • String
  • 枚举类型
  • Number 部分子类,如 Long 和 Double 等数值包装类型,BigInteger 和 BigDecimal 等大数据类型。但同为 Number 的原子类 AtomicInteger 和 AtomicLong 则是可变的。

对于集合类型,可以使用 Collections.unmodifiableXXX() 方法来获取一个不可变的集合。

今天的并发编程的基础理论知识就聊到这,主要引出了为什么要使用多线程,使用多线程会造成什么问题及怎么解决这些问题的理论知识,下篇开始介绍如何使用java中的多线程。

安利时刻:

image-20220714114938715


Java并发编程系列之一并发理论基础
http://www.sky1998.cn/2022/03/17/Java/并发编程/Java并发编程系列之一并发理论基础/
作者
程序员田同学
发布于
2022年3月17日
许可协议