Java中几种保障线程安全的设计技术

蓝月亮

发布于 2020-9-16 13:01

浏览

0收藏

说明：以下我主要从面向对象设计的角度出发介绍几种保障线程安全的设计技术，这些技术可以
使得我们在不必借助同步锁的情况下保障线程安全，这就避免锁可能导致的问题及其资源的开销。

文章目录

一、变量定义为局部变量
二、无状态（数据）对象
三、不可变对象（final）
四、构建线程私有对象
五、装饰器模式
六、总结五种方式实现线程安全

开篇先说一下，什么时候才会出现线程安全问题？也就是线程安全问题发生是哪三个条件？

条件一：存在共享变量（允许多个线程同时去操作的变量）；
条件二：得是在多线程的环境下。其中客户端访问服务端天生就是多线程环境；
条件三：存在多个线程操作共享变量时涉及到存储的过程，也就是改变共享变量的状态。

举一个是线程安全的存在共享数据并且是多线程环境的例子：Spring中的 bean 就是这样的，我们都知道 bean 有且只有一个，还是在服务端，是一个天然的多线程环境，还是被多个线程所共享的。那么它为什么还是线程安全的呢？

我的理解是 bean 中没有涉及到数据的存储过程。SpringMVC层的 Controller 注入 Spring 层的 Service ，Service 又注入 Mybatis 的 Dao ，Dao 的 mapper 里面的 Sql 语句，这时才去数据库操作数据。整个过程中只有在数据库中才涉及到了数据的存储。 bean 虽然是在多线程的环境和是共享的数据，但是它没有涉及数据

的存储，所以它是线程安全的。

回到主题：保障线程安全的设计技术

一、变量定义为局部变量

JVM里规定，Java运行数据区划分为以下五部分：

线程私有：Java虚拟机栈、本地方法栈、程序计数器
线程共享：堆空间、方法区（非堆）

1、Java虚拟机栈：

栈空间(Stack Space)为线程的执行准备一段固定大小的存储空间，每个线程都有独立的线程栈空间，创建线程时就为线程分配栈空间。

在线程栈中每调用一个方法就给方法分配一个栈帧，栈帧用于存储方法的局部变量、操作数栈、方法返回地址、动态链接、还有一些附加信息。即局部变量存储在栈空间中，基本类型变量也是存储在栈空间中，引用类型变量值也是存储在栈空间中，引用的对象存储在堆中。由于Java虚拟机栈是相互独立的，一个线程不能访问另外一个线程的栈空间，因此线程对局部变量以及只能通过当前线程的局部变量才能访问的对象进行的操作具有固定的线程安全性。

2、堆空间

堆空间(Heap Space)用于存储对象的。是在JVM启动时分配的一段可以动态扩容的内存空间。创建对象时在堆空间中给对象分配存储空间，实例变量就是存储在堆空间中的，堆空间是多个线程之间可以共享的空间，因此实例变量可以被多个线程共享。多个线程同时操作实例变量可能存在线程安全问题。

但是堆空间也不是吃素的，JVM在堆空间中开辟了一共占堆空间 1% 的内存大小的 TLAB 区域，创建线程时就会给该线程分配一段TLAB这个区域的一小部分，这样每一个线程都私有了一份TLAB，这样在对堆空间变量的引用时就是独立的了，因为每一个线程的的TLAB区域是私有的。

3、方法区（非堆）

方法区空间(Non-Heap Space)用于存储常量、类的元数据、JIT编译的热点代码等，非堆空间也是在JVM启动时分配的一段可以动态扩容的存储空间。类的元数据包括静态变量、类有哪些方法、属性及这些方法的元数据(方法名、参数、返回值等)。非堆空间也是多个线程可以共享的，因此访问非堆空间中的静态变量也可能存在线程安全问题。

总结：堆空间和方法区空间是线程共享的空间，即实例变量与静态变量是线程可以共享的，可能存在线程安全问题。栈空间是线程私有的存储空间，局部变量存储在栈空间中，局部变量具有固定的线程安全性。

所以我们在开发过程中定义变量时，能够定义为局部变量的变量就尽量定义为局部变量，而不要定义为全局变量

主要有以下两个角度去分析一下原因：

（1）就像上面所说的，局部变量是在方法内部定义的，方法在调用时是会被压入Java虚拟机栈的局部变量表中，而栈是不会涉及垃圾回收的，没有引用就是直接出栈了，这样就会提高性能，减少垃圾回收的成本。

（2）当定义为局部变量，JVM在进行逃逸分析后。假如是未逃逸状态的话，有可能就会采用栈上分配策略，栈上分配对象的话，用完就直接销毁，这样也不会涉及垃圾回收（注意：Java虚拟机栈是不用垃圾回收的，垃圾回收主要是在堆空间，方法区一般是不会进行垃圾回收的，因为它的回收效率是极低的）。

二、无状态（数据）对象

对象就是数据及对数据操作的封装，对象所包含的数据称为对象的状态(State)，实例变量与静态变量称为状态变量。

如果一个类的同一个实例被多个线程共享并不会使这些线程存储共享的状态，那么该类的实例就称为无状态对象(Stateless Object)。反之如果一个类的实例被多个线程共享会使这些线程存在共享状态，那么该类的实例称为有状态对象。

实际上无状态对象就是不包含任何实例变量(数据)也不包含任何静态变量的对象。线程安全问题的前提是多个线程存在共享的数据，实现线程安全的一种办法就是避免在多个线程之间共享数据，使用无状态对象就是这种方法。

简单理解就是：创建对象，但是对象里面不去申明共享数据（无状态），那么就是不会存在线程安全问题。

三、不可变对象（final）

1、不可变对象是指一经创建它的状态就保持不变的对象，不可变对象具有固有的线程安全性。当不可变对象实体的状态发生变化时，系统会创建一个新的不可变对象，就如 String 字符串对象。所以 String 是不可以动态扩容和去修改的（只会去新建一个新的 String 对象）

Java中几种保障线程安全的设计技术-鸿蒙开发者社区

2、自定义一个不可变对象需要满足以下条件：

（1）类本身使用final修饰，防止通过创建子类来改变它的定义；
（2）所有的字段都是 final 修饰的，final 字段在创建对象时必须显示初始化并且不能被修改；
（3）如果字段引用了其他状态可变的对象(集合、数组)，则这些字段必须是private私有的。

Java中几种保障线程安全的设计技术-鸿蒙开发者社区

3、关于final 关键字的拓展：

（1）被 final 修饰的对象，在类加载阶段是直接在链接阶段中准备阶段就是被显示初始化了，它与static 修饰的对象是在同一阶段被加载的。

（2）假如被final 修饰的变量，被频繁更改，那么就会不断地创建新的对象，这样就会额外的增加垃圾回收的频率，影响性能。

（3）但是从另一个层面来说，使用final 还会降低垃圾回收，怎么说呢？我们都知道堆中有年轻代和老年代，当用年轻代中用final 修饰的变量被老年代所引用，这个引用时间一般都会很长，因为 final 修饰的对象是随着 JVM 启动而启动，销毁而销毁的。所以一直引用着老年代的对象，那么老年代的对象就不会被垃圾回收掉，这样就降低了垃圾回收的频率。但是又拿来了一个问题，垃圾一直回收不到，内存报 OOM 的概率就提升了。所以没有好坏之分，分析问题要全面均衡一下。

4、不可变对象主要的应用场景：

（1）被建模对象的状态变化不频繁，比如说，一个数字变量、一个字符串变量…

（2）同时对一组相关数据进行写操作（一次性写入），可以应用不可变对象，既可以保障原子性也可以避免锁的使用；

（3）使用不可变对象作为安全可靠的 Map 的键（key），HashMap 键值对的存储位置与键的 hashCode() 有关，如果键的内部状态发生了变化会导致键的哈希码不同，可能会影响键值对的存储位置。如果HashMap的键是一个不可变对象，则 hashCode()方法的返回值恒定，存储位置是固定的。

四、构建线程私有对象

我们可以选择不共享非线程安全的对象，对于非线程安全的对象，每个线程都创建一个该对象的实例（也就是说，谁是不安全的对象，就给每一个线程都私有分配一份），各个线程线程访问各自创建的实例，一个线程不能访问另外一个线程创建的实例。

这种各个线程创建各自的实例，一个实例只能被一个线程访问的对象就称为线程特有对象。线程特有对象既保障了对非线程安全对象的访问的线程安全，又避免了锁的开销。线程特有对象也具有固有的线程安全性。

ThreadLocal < T > 类相当于线程访问其特有对象的代理，即各个线程通过 ThreadLocal 对象可以创建并访问各自的线程特有对象，泛型T指定了线程特有对象的类型。一个线程可以使用不同的ThreadLocal实例来创建并访问不同的线程特有对象。ThreadLocal就是为每一线程创建一个特有的副本，以此来做到数据不共享，保证线程安全问题。

Java中几种保障线程安全的设计技术-鸿蒙开发者社区