深入理解编译优化之循环展开和粗化锁-天翼云

深入理解编译优化之循环展开和粗化锁

2024-05-13 07:32:14 阅读次数：41

简介

之前在讲JIT的时候，有提到在编译过程中的两种优化循环展开和粗化锁，今天我们和小师妹一起从Assembly的角度来验证一下这两种编译优化方法，快来看看吧。

循环展开和粗化锁

小师妹:F师兄，上次你讲到在JIT编译的过程中会进行一些编译上面的优化，其中就有循环展开和粗化锁。我对这两种优化方式很感兴趣，能不能展开讲解一下呢？

当然可以，我们先来回顾一下什么是循环展开。

循环展开就是说，像下面的循环遍历的例子：

for (int i = 0; i < 1000; i++) {
                x += 0x51;
        }

因为每次循环都需要做跳转操作，所以为了提升效率，上面的代码其实可以被优化为下面的：

for (int i = 0; i < 250; i++) {
                x += 0x144; //0x51 * 4
        }

注意上面我们使用的是16进制数字，至于为什么要使用16进制呢？这是为了方便我们在后面的assembly代码中快速找到他们。

好了，我们再在 x += 0x51 的外面加一层synchronized锁，看一下synchronized锁会不会随着loop unrolling展开的同时被粗化。

for (int i = 0; i < 1000; i++) {
            synchronized (this) {
                x += 0x51;
            }
 }

万事具备，只欠我们的运行代码了，这里我们还是使用JMH来执行。

相关代码如下：

@Warmup(iterations = 10, time = 1, timeUnit = TimeUnit.SECONDS)
@Measurement(iterations = 5, time = 1, timeUnit = TimeUnit.SECONDS)
@Fork(value = 1,
        jvmArgsPrepend = {
        "-XX:-UseBiasedLocking",
                "-XX:CompileCommand=print,com.flydean.LockOptimization::test"
}
        )
@State(Scope.Benchmark)
@BenchmarkMode(Mode.AverageTime)
@OutputTimeUnit(TimeUnit.NANOSECONDS)
public class LockOptimization {

    int x;
    @Benchmark
    @CompilerControl(CompilerControl.Mode.DONT_INLINE)
    public void test() {
        for (int i = 0; i < 1000; i++) {
            synchronized (this) {
                x += 0x51;
            }
        }
    }

    public static void main(String[] args) throws RunnerException {
        Options opt = new OptionsBuilder()
                .include(LockOptimization.class.getSimpleName())
                .build();
        new Runner(opt).run();
    }
}

上面的代码中，我们取消了偏向锁的使用：-XX:-UseBiasedLocking。为啥要取消这个选项呢？因为如果在偏向锁的情况下，如果线程获得锁之后，在之后的执行过程中，如果没有其他的线程访问该锁，那么持有偏向锁的线程则不需要触发同步。

为了更好的理解synchronized的流程，这里我们将偏向锁禁用。

其他的都是我们之前讲过的JMH的常规操作。

接下来就是见证奇迹的时刻了。

分析Assembly日志

我们运行上面的程序，将会得到一系列的输出。因为本文并不是讲解Assembly语言的，所以本文只是大概的理解一下Assembly的使用，并不会详细的进行Assembly语言的介绍，如果有想深入了解Assembly的朋友，可以在文后留言。

分析Assembly的输出结果，我们可以看到结果分为C1-compiled nmethod和C2-compiled nmethod两部分。

先看C1-compiled nmethod：

第一行是monitorenter,表示进入锁的范围，后面还跟着对于的代码行数。

最后一行是monitorexit,表示退出锁的范围。

中间有个add $0x51,%eax操作，对于着我们的代码中的add操作。

可以看到C1—compiled nmethod中是没有进行Loop unrolling的。

我们再看看C2-compiled nmethod:

和C1很类似，不同的是add的值变成了0x144,说明进行了Loop unrolling，同时对应的锁范围也跟着进行了扩展。

最后看下运行结果：

Benchmark              Mode  Cnt     Score     Error  Units
LockOptimization.test  avgt    5  5601.819 ± 620.017  ns/op

得分还不错。

禁止Loop unrolling

接下来我们看下如果将Loop unrolling禁掉，会得到什么样的结果。

要禁止Loop unrolling，只需要设置-XX:LoopUnrollLimit=1即可。

我们再运行一下上面的程序:

深入理解编译优化之循环展开和粗化锁

可以看到C2-compiled nmethod中的数字变成了原本的0x51，说明并没有进行Loop unrolling。

再看看运行结果：

Benchmark              Mode  Cnt      Score      Error  Units
LockOptimization.test  avgt    5  20846.709 ± 3292.522  ns/op

可以看到运行时间基本是优化过后的4倍左右。说明Loop unrolling还是非常有用的。

总结

本文介绍了循环展开和粗化锁的实际例子，希望大家能够喜欢。

活动

智算服务

应用商城

合作伙伴

开发者

支持与服务

了解天翼云

深入理解编译优化之循环展开和粗化锁

深入理解编译优化之循环展开和粗化锁

简介

循环展开和粗化锁

分析Assembly日志

禁止Loop unrolling

总结

相关文章

java使用JDBC方式操作mysql数据库示例

Java的几种常用包

java中final的用法

牛客网刷题(2)（Java之JDK目录、集合框架图、内存管理、对象生命周期、垃圾回收机制）

Javaweb编程中的乱码问题

软件开发入门之Java 抽象类

使用ZipEntry解压zip文件报错: java.lang.IllegalArgumentException: MALFORMED

java9系列第二篇-资源自动关闭的语法增强

Java实战之管家婆记账系统（15）——按备注条件查询界面及功能实现

Java实战之亲戚关系计算器（swing版）（3）——界面设计

作者介绍

最新文章

java中final的用法

使用ZipEntry解压zip文件报错: java.lang.IllegalArgumentException: MALFORMED

总结java中文件拷贝剪切的5种方式-JAVA IO基础总结第五篇

JAVA本地编译运行出现的找不到类名问题

java读取shapefile且用arcgis for js展示

java 自定义注解

热门文章

GC是什么? 为什么要有GC?

在java正则表达式中为什么要对 . 进行两次的转义操作 （\\.）才表示真正的 .

axios&spring前后端分离传参规范总结

Jsp Ajax之模拟用户注册

定义一个函数，接收三个参数返回一元二次方程

JAVA基础加强笔记

热门标签

相关产品

弹性云主机

天翼云电脑（公众版）

对象存储

云硬盘

随机文章

java for 遍历(:方式)时操作的问题和其他遍历方式的思考

Linux下常用的监控工具和命令

8位的能表示的范围是±2^7(最高位做符号位)，也就是±128，为什么单精度浮点数的指数范围却是-126~127呢？

java获取当前日期和时间（各种方法对比）

贩卖机只支持硬币支付，且收退都只支持10 ，50，100三种面额。

全网详细解决java.lang.ClassCastException: xxx类型 cannot be cast to xxx类型

在java正则表达式中为什么要对 . 进行两次的转义操作（\\.）才表示真正的 .