一次群聊引发的血案(二)
一切都是猜测
如果依据这个解释,来回答群内提出的问题貌似也可以解释的通。
因为 map 在 put 的时候可以不管 new 对象时候的指令重排,只要能拿到对象引用的内存地址就可以了,所以另外一个线程如果去 get 的话就可能拿到一个空值。
从as-if-serial的语义来看,确实不会改变单线程内的执行结果,但是还有一点说的是只要数据没有依赖关系,就都可以重排序。问题的关键点在于 put 这个到底有依赖关系吗?依赖关系怎么定义?
如果是最简单的比如 x=1,y=2 那么我们可以认为完全没有依赖关系,可以指令重排。如果是 x=1,y=x+1 那么由于单线程内y依赖于x,所以不能指令重排。
那么 map.put(key,new B(value)) 呢?
一道证明题
Jcstress(Java Concurrency Stress)是一个帮助测试JVM和硬件并发正确性的工具库。
首先,先证明DCL的问题是否确实存在,是否真的在另外的线程中能看到未完全初始化的对象。代码如下:
通过测试代码,如果最终能输出0,1,2,3那么代表确实是能拿到未完全初始化完成的对象。
首先对代码 mvn clean install 打包,然后执行命令:
java -XX:-UseCompressedOops -XX:+UnlockDiagnosticVMOptions -XX:CompileCommand="print com.jcst.UnsafePublication_jcstress*::call" -XX:CompileCommand="inline, com.jcst.UnsafePublication::publish" -XX:+PrintAssembly -jar target/jcstress.jar -f -1 -t UnsafePublication -v > log2.txt
执行完成之后,查看输出结果发现问题确实存在:
而且,通过生成的汇编指令,也可以看到发生了指令重排,引用被先赋值,对象还没有完全初始化完成。但是实际测试过程中,这个问题并不好复现,需要反复的测试才有可能拿到我们想要的结果。
有了基础的事实之后,再继续修改代码,如果加上 map 操作还能出现这个现象的话,那么证明实际上 map 的 put 操作也是同样存在可能性的。
如果同样我们能得到汇编的结果,put 的操作也被指令重排发生在初始化完成之前的话,那么就可以证明我们的猜测了。
结果和我们之前预料的不太一致,无论怎么修改代码顺序,测试脚本都是执行通过。这说明 put 不会把一个没有初始化完成的对象给保存进去。
总结
由于指令重排发生的场景非常多而且也非常底层,目前我们能看到的资料无非就告诉我们单线程结果不能改变,数据不能有依赖性,这样的话就能指令重排。
而我们的代码从 Java 通过 javac 编译成字节码,再经过 JIT 动态编译成机器码,从机器码再经过处理器,到缓存这些过程都可能发生指令重排。而编译器、处理器、缓存这些根据机器、硬件环境不同,又都可能造成不同的影响。
通过DCL的已知问题和最后根据jcstress得到汇编的结果来看,由于没有改变单线程最终结果,指令重排是确实发生了。但是从 map 的 put 的结果来看,最终结论是不会,put 操作不会把一个没有初始化完成的对象保存进去。
而我也尝试了不少其他的方式,比如打印、模拟 map 写了一个空方法,只是用到了引用对象,测试结果无一都是通过,所以大胆猜测使用了引用其实也是依赖的一种,这样就不会导致重排的发生。
最后,如果你有更好的证实的方法,或者有不同的意见可以证实结论的错误性,欢迎拍砖打脸指正。
参考:
https://stackoverflow.com/questions/35883354/is-there-any-instruction-reordering-done-by-the-hotspot-jit-compiler-that-can-be/64941168#64941168
https://stackoverflow.com/questions/42079959/explain-how-jit-reordering-works?answertab=votes#tab-top
文章转自公众号:艾小仙