浅谈JVM调优

促使我写下这篇文章的是软件构造Lab5中中尝试JVM参数调优的时候，程序的效率提高一了倍，由此可见参数对于Java程序重要性，下面就简述一下我在Lab5里面调优的过程以及参数的简介。

一.前言

先说明一下，这里的JVM参数，其实就是调整JVM的GC策略以及GC的各个部分大小，下面会给出详细说明。

二.GC策略以及各部分的分布

先讲讲基本的四种算法吧

1.引用计数算法（Reference counting）

这个算法还是比较好理解的，顾名思义，就是有一个为每一个对象储存一个计数器，当每有引用（别名）指向它时，计数器就加一个，当这个引用断开时，计数器就减一，当检测计数器为0的时候就回收这个对象。

优点：简单，计算代价分散，幽灵时间短
缺点：容易漏掉对象（循环的时候），并发难，计数都保存在一个内存池里面，多线程容易出问题，而且还占用额外的内存空间等等问题。

2.标记-清除算法（Mark-Sweep）

这个算法也不难理解，上面那个储存一个对引用的计数器，这里是储存一个状态位来记录这个对象是live还是dead，称此为mark阶段，然后就是对标记了dead的对象进行清理，即sweep阶段。

优点：运行时对开销比较小（不用对每一个引用都记录，一个即可）
缺点：和上面不同，mark和sweep需要程序停下来才能执行，导致额外的幽灵时间大增，会影响程序性能，而且回收的时候是就地回收的，会导致内存碎片化，为后来的要使用内存的对象再利用造成困难。

3.标记-整理算法（Mark-Compact）

这个相比于上面就是多了整理的阶段，在清除完以后，为了避免内存碎片化，将内存中有用的对象重新整理储存。

优点：避免碎片化
缺点：相比于上面增加了整理，耗费的时间肯定比上面多，但是继续运行的时候对内存的继续使用会好很多，算是一种妥协。

4.复制（Fragmentation and Copying）

这个是基于上面那个整理算法的，只不过上面那个是在原本的内存里面整理，而这个是将所有的存活对象复制到另外一个区域，用空间换时间。

优点：相比于上面的时间消耗要短很多。
缺点：相比于上面的耗费了大量的内存空间。

三：JVM内存管理

这里稍微介绍一下JVM里面的内存分布，先上一张图：

不难看出Object出生在Eden（伊甸园）里面，然后经过Young GC后进入S1，S2（From，To）区域，能够在S1和S2里面交换储存，然后将存活时间比较久的放到Old区里面，在Old区快满的时候，将会进行Full GC，这里的Young GC和Full GC使用的是不同的策略，Young GC比较由于频繁且空间比较小，采用的是Copy算法，Full GC空间大，不同的程序的需求不同，这时候就需要在调节JVM的参数，对于不同的程序，young的空间和Old空间的需求也不同，有的程序新生代相当多，就需要调整Eden多区域，有的程序新生代和老一代划分明显，不需要过多判断，就可以将S1和S2区域调节的小一点，减少缓冲时间，直接进入Old区域等等等等。

四：实战调参

上面说了这么多的废话终于进入正题了，到底怎么样去调参呢？可以调节的参数有哪些呢？先上图：

从这个图里面可以很容易与上面的图对应起来，上下写的类似“-XX:NewSize”这样的东西就是参数，可以吧这个东西写到eclipse右键run configure里面的arguments的下面的VM参数里面，idea里面也有相关的设置的工具，这上面的这些东西都是相关于内存空间的，可以根据自己的程序里面的Object的更新速度，以及需要GC的频率，和是否异常，来根据需要大致调节一下，然后可以慢慢值试来达到对于程序能够达到最快的性能的程度。

附录：参数大全

 -Xms512m
 -Xmx512m
 -XX:MetaspaceSize=128m
 -XX:MaxMetaspaceSize=128m
 -XX:NewSize=128m
 -XX:MaxNewSize=128m
 -XX:SurvivorRatio=8
 -XX:+DisableExplicitGC
 -XX:+PrintGCDetails
 -XX:+UseConcMarkSweepGC
 -XX:ParallelCMSThreads=12
 -verbose:gc
 -XX:+HeapDumpOnOutOfMemoryError
 -XX:+PrintGCTimeStamps
 -Xloggc:../../logs/gc-console.log

部分参数介绍：（以下转载自：https://www.cnblogs.com/marcotan/p/4256885.html）

-Xmx3550m：设置JVM最大堆内存为3550M。
-Xms3550m：设置JVM初始堆内存为3550M。此值可以设置与-Xmx相同，以避免每次垃圾回收完成后JVM重新分配内存。
-Xss128k：设置每个线程的栈大小。JDK5.0以后每个线程栈大小为1M，之前每个线程栈大小为256K。应当根据应用的线程所需内存大小进行调整。在相同物理内存下，减小这个值能生成更多的线程。但是操作系统对一个进程内的线程数还是有限制的，不能无限生成，经验值在3000~5000左右。需要注意的是：当这个值被设置的较大（例如>2MB）时将会在很大程度上降低系统的性能。
-Xmn2g：设置年轻代大小为2G。在整个堆内存大小确定的情况下，增大年轻代将会减小年老代，反之亦然。此值关系到JVM垃圾回收，对系统性能影响较大，官方推荐配置为整个堆大小的3/8。
-XX:NewSize=1024m：设置年轻代初始值为1024M。
-XX:MaxNewSize=1024m：设置年轻代最大值为1024M。
-XX:PermSize=256m：设置持久代初始值为256M。
-XX:MaxPermSize=256m：设置持久代最大值为256M。
-XX:NewRatio=4：设置年轻代（包括1个Eden和2个Survivor区）与年老代的比值。表示年轻代比年老代为1:4。
-XX:SurvivorRatio=4：设置年轻代中Eden区与Survivor区的比值。表示2个Survivor区（JVM堆内存年轻代中默认有2个大小相等的Survivor区）与1个Eden区的比值为2:4，即1个Survivor区占整个年轻代大小的1/6。
-XX:MaxTenuringThreshold=7：表示一个对象如果在Survivor区（救助空间）移动了7次还没有被垃圾回收就进入年老代。如果设置为0的话，则年轻代对象不经过Survivor区，直接进入年老代，对于需要大量常驻内存的应用，这样做可以提高效率。如果将此值设置为一个较大值，则年轻代对象会在Survivor区进行多次复制，这样可以增加对象在年轻代存活时间，增加对象在年轻代被垃圾回收的概率，减少Full GC的频率，这样做可以在某种程度上提高服务稳定性。

疑问解答

-Xmn，-XX:NewSize/-XX:MaxNewSize，-XX:NewRatio 3组参数都可以影响年轻代的大小，混合使用的情况下，优先级是什么？
如下：
高优先级：-XX:NewSize/-XX:MaxNewSize
中优先级：-Xmn（默认等效 -Xmn=-XX:NewSize=-XX:MaxNewSize=?）
低优先级：-XX:NewRatio
推荐使用-Xmn参数，原因是这个参数简洁，相当于一次设定 NewSize/MaxNewSIze，而且两者相等，适用于生产环境。-Xmn 配合 -Xms/-Xmx，即可将堆内存布局完成。
-Xmn参数是在JDK 1.4 开始支持。

垃圾回收器选择

JVM给出了3种选择：串行收集器、并行收集器、并发收集器。串行收集器只适用于小数据量的情况，所以生产环境的选择主要是并行收集器和并发收集器。
默认情况下JDK5.0以前都是使用串行收集器，如果想使用其他收集器需要在启动时加入相应参数。JDK5.0以后，JVM会根据当前系统配置进行智能判断。
串行收集器
-XX:+UseSerialGC：设置串行收集器。
并行收集器（吞吐量优先）
-XX:+UseParallelGC：设置为并行收集器。此配置仅对年轻代有效。即年轻代使用并行收集，而年老代仍使用串行收集。
-XX:ParallelGCThreads=20：配置并行收集器的线程数，即：同时有多少个线程一起进行垃圾回收。此值建议配置与CPU数目相等。
-XX:+UseParallelOldGC：配置年老代垃圾收集方式为并行收集。JDK6.0开始支持对年老代并行收集。
-XX:MaxGCPauseMillis=100：设置每次年轻代垃圾回收的最长时间（单位毫秒）。如果无法满足此时间，JVM会自动调整年轻代大小，以满足此时间。
-XX:+UseAdaptiveSizePolicy：设置此选项后，并行收集器会自动调整年轻代Eden区大小和Survivor区大小的比例，以达成目标系统规定的最低响应时间或者收集频率等指标。此参数建议在使用并行收集器时，一直打开。
并发收集器（响应时间优先）
-XX:+UseConcMarkSweepGC：即CMS收集，设置年老代为并发收集。CMS收集是JDK1.4后期版本开始引入的新GC算法。它的主要适合场景是对响应时间的重要性需求大于对吞吐量的需求，能够承受垃圾回收线程和应用线程共享CPU资源，并且应用中存在比较多的长生命周期对象。CMS收集的目标是尽量减少应用的暂停时间，减少Full GC发生的几率，利用和应用程序线程并发的垃圾回收线程来标记清除年老代内存。
-XX:+UseParNewGC：设置年轻代为并发收集。可与CMS收集同时使用。JDK5.0以上，JVM会根据系统配置自行设置，所以无需再设置此参数。
-XX:CMSFullGCsBeforeCompaction=0：由于并发收集器不对内存空间进行压缩和整理，所以运行一段时间并行收集以后会产生内存碎片，内存使用效率降低。此参数设置运行0次Full GC后对内存空间进行压缩和整理，即每次Full GC后立刻开始压缩和整理内存。
-XX:+UseCMSCompactAtFullCollection：打开内存空间的压缩和整理，在Full GC后执行。可能会影响性能，但可以消除内存碎片。
-XX:+CMSIncrementalMode：设置为增量收集模式。一般适用于单CPU情况。
-XX:CMSInitiatingOccupancyFraction=70：表示年老代内存空间使用到70%时就开始执行CMS收集，以确保年老代有足够的空间接纳来自年轻代的对象，避免Full GC的发生。
其它垃圾回收参数
-XX:+ScavengeBeforeFullGC：年轻代GC优于Full GC执行。
-XX:-DisableExplicitGC：不响应 System.gc() 代码。
-XX:+UseThreadPriorities：启用本地线程优先级API。即使 java.lang.Thread.setPriority() 生效，不启用则无效。
-XX:SoftRefLRUPolicyMSPerMB=0：软引用对象在最后一次被访问后能存活0毫秒（JVM默认为1000毫秒）。
-XX:TargetSurvivorRatio=90：允许90%的Survivor区被占用（JVM默认为50%）。提高对于Survivor区的使用率。
辅助信息参数设置
-XX:-CITime：打印消耗在JIT编译的时间。
-XX:ErrorFile=./hs_err_pid.log：保存错误日志或数据到指定文件中。
-XX:HeapDumpPath=./java_pid.hprof：指定Dump堆内存时的路径。
-XX:-HeapDumpOnOutOfMemoryError：当首次遭遇内存溢出时Dump出此时的堆内存。
-XX:OnError=";"：出现致命ERROR后运行自定义命令。
-XX:OnOutOfMemoryError=";"：当首次遭遇内存溢出时执行自定义命令。
-XX:-PrintClassHistogram：按下 Ctrl+Break 后打印堆内存中类实例的柱状信息，同JDK的 jmap -histo 命令。
-XX:-PrintConcurrentLocks：按下 Ctrl+Break 后打印线程栈中并发锁的相关信息，同JDK的 jstack -l 命令。
-XX:-PrintCompilation：当一个方法被编译时打印相关信息。
-XX:-PrintGC：每次GC时打印相关信息。
-XX:-PrintGCDetails：每次GC时打印详细信息。
-XX:-PrintGCTimeStamps：打印每次GC的时间戳。
-XX:-TraceClassLoading：跟踪类的加载信息。
-XX:-TraceClassLoadingPreorder：跟踪被引用到的所有类的加载信息。
-XX:-TraceClassResolution：跟踪常量池。
-XX:-TraceClassUnloading：跟踪类的卸载信息。

关于参数名称等

标准参数（-），所有JVM都必须支持这些参数的功能，而且向后兼容；例如：
-client——设置JVM使用Client模式，特点是启动速度比较快，但运行时性能和内存管理效率不高，通常用于客户端应用程序或开发调试；在32位环境下直接运行Java程序默认启用该模式。
-server——设置JVM使Server模式，特点是启动速度比较慢，但运行时性能和内存管理效率很高，适用于生产环境。在具有64位能力的JDK环境下默认启用该模式。
非标准参数（-X），默认JVM实现这些参数的功能，但是并不保证所有JVM实现都满足，且不保证向后兼容；
非稳定参数（-XX），此类参数各个JVM实现会有所不同，将来可能会不被支持，需要慎重使用；

JVM服务参数调优实战

大型网站服务器案例

承受海量访问的动态Web应用
服务器配置：8 CPU, 8G MEM, JDK 1.6.X
参数方案：
-server -Xmx3550m -Xms3550m -Xmn1256m -Xss128k -XX:SurvivorRatio=6 -XX:MaxPermSize=256m -XX:ParallelGCThreads=8 -XX:MaxTenuringThreshold=0 -XX:+UseConcMarkSweepGC
调优说明：
-Xmx 与 -Xms 相同以避免JVM反复重新申请内存。-Xmx 的大小约等于系统内存大小的一半，即充分利用系统资源，又给予系统安全运行的空间。
-Xmn1256m 设置年轻代大小为1256MB。此值对系统性能影响较大，Sun官方推荐配置年轻代大小为整个堆的3/8。
-Xss128k 设置较小的线程栈以支持创建更多的线程，支持海量访问，并提升系统性能。
-XX:SurvivorRatio=6 设置年轻代中Eden区与Survivor区的比值。系统默认是8，根据经验设置为6，则2个Survivor区与1个Eden区的比值为2:6，一个Survivor区占整个年轻代的1/8。
-XX:ParallelGCThreads=8 配置并行收集器的线程数，即同时8个线程一起进行垃圾回收。此值一般配置为与CPU数目相等。
-XX:MaxTenuringThreshold=0 设置垃圾最大年龄（在年轻代的存活次数）。如果设置为0的话，则年轻代对象不经过Survivor区直接进入年老代。对于年老代比较多的应用，可以提高效率；如果将此值设置为一个较大值，则年轻代对象会在Survivor区进行多次复制，这样可以增加对象再年轻代的存活时间，增加在年轻代即被回收的概率。根据被海量访问的动态Web应用之特点，其内存要么被缓存起来以减少直接访问DB，要么被快速回收以支持高并发海量请求，因此其内存对象在年轻代存活多次意义不大，可以直接进入年老代，根据实际应用效果，在这里设置此值为0。
-XX:+UseConcMarkSweepGC 设置年老代为并发收集。CMS（ConcMarkSweepGC）收集的目标是尽量减少应用的暂停时间，减少Full GC发生的几率，利用和应用程序线程并发的垃圾回收线程来标记清除年老代内存，适用于应用中存在比较多的长生命周期对象的情况。

内部集成构建服务器案例

高性能数据处理的工具应用
服务器配置：1 CPU, 4G MEM, JDK 1.6.X
参数方案：
-server -XX:PermSize=196m -XX:MaxPermSize=196m -Xmn320m -Xms768m -Xmx1024m
调优说明：
-XX:PermSize=196m -XX:MaxPermSize=196m 根据集成构建的特点，大规模的系统编译可能需要加载大量的Java类到内存中，所以预先分配好大量的持久代内存是高效和必要的。
-Xmn320m 遵循年轻代大小为整个堆的3/8原则。
-Xms768m -Xmx1024m 根据系统大致能够承受的堆内存大小设置即可。

我的Lab5调优实例

一开始觉得是调整大新生代的大小，但是试了一下，好像没有什么作用，后来尝试了多次，发现在快速读取文件并且构建的时候，是不可能不很快就GC的，然后我就接受了这个事实，后来我也不知道该怎么样才算好的调参，然后就针对前面的IO时间进行调整，一点一点试参数，最后尝试最优参数可以让我的I/O时间减少一半！果然是这个参数作用很重要啊！下面是我的参数：
-XX:MetaspaceSize=128m //方法不多，空间小一点
-XX:MaxMetaspaceSize=128m //和上面一样，因为扩张会消耗时间
-XX:SurvivorRatio=32 //让其过渡快一点
-Xms512m
-Xmx512m
-Xmn128m
-verbose:gc //打印gc记录
-XX:+PrintGCDetails //打印细节
-Xloggc:logs/gc.log //将记录储存到**文件夹

1人点赞