JVM虚拟机篇

JVM介绍、运行流程

JVM是什么

Java Virtual Machine,Java程序的运行环境(java二进制字节码的运行环境)

好处

  • 一次编写,到处运行
  • 自动内存管理,垃圾回收机制

JVM由哪些部分组成,运行流程是什么

image-20250210211936973

  1. 将java代码转换为字节码
  2. 将字节码加载到内存中
  3. 将字节码翻译为底层系统指令
  4. 调用本地方法接口(用C++或者C实现的)

JVM组成

什么是程序计数器

线程私有的(所以不存在线程安全问题),内部保存的是字节码的行号。用于记录正在执行的字节码的指令的地址。

你能详细介绍下Java堆吗

线程共享的区域:主要用来保存对象实例,数组等,当堆中没有内存空间可分配给实例,也无法再扩展时,则抛出OutOfMemoryError异常。

堆中主要包括两部分——年轻代和老年代。

年轻代被划分为三部分,Eden区和两个大小严格相同的Survivor区,根据JVM的策略,在经过几次垃圾收集后,仍然存活于Survivor的对象将被转移到老年代区间。

老年代主要保存生命周期长的对象,一般是一些老的对象。

jdk1.7和1.8的区别

  • 1.7中有一个永久代,存储的是类信息、静态变量、常量、编译后的代码
  • 1.8移除了永久代,把数据存储到了本地内存的元空间中,防止内存溢出

能不能介绍一下方法区

  • 也叫元空间,是各个线程共享的内存区域
  • 主要存储类的信息、运行时常量池
  • 虚拟机启动的时候创建,关闭虚拟机时释放
  • 如果方法区中的内存无法满足分配请求,则会抛出OutOfMemoryError: Metaspace

介绍一下运行时常量池

  • 常量池:可以看作是一张表,虚拟机指令根据这张常量表找到要执行的类名、方法名、参数类型、字面量等信息。

  • 常量池是*.class文件中的,当该类被加载,它的常量池信息就会放入运行时常量池,并把里面的符号地址变为真实地址

听说过直接内存吗

直接内存并不属于JVM中的内存结构,不由JVM进行管理。是虚拟机的系统内存,常见于NIO操作,用于数据缓冲区,它分配回收成本较高,但读写性能高。不受JVM内存回收管理。

image-20250211213026815

常规IO的数据拷贝需要两块缓冲区,读取时数据需要存两份(因为java代码本身访问不到系统缓冲区),效率较低。

image-20250211213248987

什么是虚拟机栈

  • 每个线程运行时所需要的内存,称为虚拟机栈,先进后出

  • 每个栈由多个栈帧(frame)组成,对应着每次方法调用时所占用的内存(参数、局部变量、返回地址)

  • 每个线程只能有一个活动栈帧,对应着当前正在执行的那个方法

垃圾回收是否涉及栈内存

垃圾回收主要指堆内存,当栈帧弹栈以后,内存就会释放,不涉及垃圾回收。

栈内存分配越大越好吗

未必,默认的栈内存通常为1024k。

机器总内存一定,栈帧过大会导致线程数变少。

例如,机器总内存为512m,目前能活动的线程数则为512个,如果把栈内存改为2048k,那么能活动的栈帧就会减半。

方法内的局部变量是否线程安全

  • 如果方法内局部变量没有逃离方法的作用范围,它就是线程安全的
  • 如果是局部变量引用了对象,并逃离方法的作用范围,需要考虑线程安全
image-20250211205432572

什么情况下会导致栈内存溢出

  • 栈帧过多导致内存溢出,典型问题:递归调用
  • 栈帧过大导致栈内存溢出

堆栈的区别是什么

  • 栈内存一般用来存储局部变量和方法调用;堆内存用来存储java对象和数组的。堆会GC垃圾回收,而栈不会。
  • 栈内存是线程私有的,而堆内存是线程共有的,需要考虑线程安全的问题。
  • 两者异常错误不同,但如果栈内存或者堆内存不足都会抛出异常。
    • 栈空间不足:java.lang.StackOverFlowError
    • 堆空间不足:java.lang.OutOfMemoryError

类加载器

什么是类加载器

JVM只会运行二进制文件,类加载器的作用就是将字节码文件加载到JVM中,从而让Java程序能够启动起来。

类加载器有哪些

  • 启动类加载器(BootStrap ClassLoader):加载JAVA_HOME/jre/lib目录下的库,由C++编写。
  • 扩展类加载器(ExtClassLoader):主要加载JAVA__HOME/jre/lib/ext目录中的类。
  • 应用类加载器(AppClassLoader):用于加载classPath下的类,加载开发者自己编写的Java类。
  • 自定义类加载器(CustomizeClassLoader):自定义类继承ClassLoader,实现自定义类加载规则。

什么是双亲委派模型

加载某一个类,先委托上一级的加载器进行加载,如果上级加载器也有上级,则会继续向上委托,如果该类委托上级没有被加载,子加载器尝试加载该类。

JVM为什么采用双亲委派机制

  1. 可以避免某一个类被重复加载,当父类已经加载后则无需重复加载,保证唯一性。

  2. 为了安全,保证类库API不会被修改。

    image-20250213204633494

说一下类装载的执行过程

类从加载到虚拟机中开始,直到卸载为止,它的整个生命周期包括了:加载、验证、准备、解析、初始化、使用和卸载这7个阶段。其中,验证、准备、解析这三个部分统称为连接(linking)

image-20250213212051881

  • 加载:查找和导入class文件

    • 通过类的全名,获取类的二进制数据流
    • 将类的二进制数据流解析为方法区内的数据结构(Java类模型)
    • 创建java.lang.Class类的实例,表示该类型。作为方法区这个类的各种数据的访问入口

    image-20250213210130132

  • 验证:验证类是否符合JVM规范,安全性检查

    • 文件格式验证
    • 元数据验证
    • 字节码验证——前三项是格式检查,如:文件格式是否错误、语法是否错误、字节码是否合规
    • 符号引用验证——Class文件在其常量池会通过字符串记录自己将要使用的其他类或者方法,检查它们是否存在
  • 准备:为类变量分配内存并设置类变量初始值

    • static变量:分配空间在准备阶段完成(设置默认值),赋值在初始化阶段完成
    • static变量是final的基本类型,以及字符串常量,值已确定,赋值在准备阶段完成
    • static变量是final的引用类型,那么赋值也会在初始化阶段完成
  • 解析:把类中的符号引用转换为直接引用

    • 比如:方法中调用了其他方法,方法名可以理解为符号引用,而直接引用就是使用指针直接指向方法
  • 初始化:对类的静态变量、静态代码块执行初始化操作

    • 如果初始化一个类的时候,其父类尚未初始化,则优先初始化其父类
    • 如果同时包含多个静态变量和静态代码块,则按照自上而下的顺序依次执行
    • 子类访问父类静态变量时,只触发父类初始化
  • 使用:JVM开始从入口方法开始执行用户的程序代码

    • 调用静态类成员信息(比如:静态字段、静态方法)
    • 使用new关键字为其创建对象实例
  • 卸载:用户程序代码执行完毕后,JVM销毁创建的class对象

垃圾回收

对象什么时候可以被垃圾器回收

如果一个或多个对象没有任何的引用指向它了,那么这个对象现在就是垃圾,如果定位了垃圾,则有可能会被垃圾回收器回收。

如果要定位什么是垃圾,有两种方法来确定,第一个是引用计数法,第二个是可达性分析算法

引用计数法

一个对象被引用了一次,在当前的对象头上递增一次引用次数,如果这个对象的引用次数为0,代表这个对象可回收。

当对象间出现了循环引用的话,则引用计数法就会失效。

image-20250217213019744

可达性分析算法

现在的虚拟机采用的都是通过可达性分析算法来确定哪些内容是垃圾。

image-20250217213130128

哪些对象可以作为GC Root?
  • 虚拟机栈(栈帧中的本地变量表)中引用的对象

    image-20250217213407762

  • 方法区中类静态属性引用的对象

    image-20250217213426195

  • 方法区中常量引用的对象

    image-20250217213521467

  • 本地方法栈中JNI(即一般说的Native方法)引用的对象

JVM垃圾回收算法有哪些

标记清除算法

是将垃圾回收分为两个阶段,分别是标记和清除

  1. 根据可达性分析算法得出的垃圾进行标记
  2. 对这些标记为可回收的内容进行垃圾分类
image-20250217213938828 image-20250217213958971

优点:标记和清除速度较快

缺点:磁盘碎片化较为严重,内存不连贯

标记整理算法

image-20250217214044871 image-20250217214051577

优缺点同标记清除算法,解决了标记清除算法的碎片化的问题,同时,标记整理算法多了一步——对象移动内存位置的步骤,其效率也有一定的影响。

一般老年代回收器使用标记整理算法

复制算法

将原有的内存一分为二,每次只用其中的一块,正在使用的对象复制到另一个内存空间中,然后将该内存空间清空,交换两个内存的角色,完成垃圾的回收。

image-20250217214235817 image-20250217214243198

优点

  • 在垃圾对象多的情况下,效率较高

  • 清理后,内存无碎片

缺点

  • 分配的两块内存空间,在同一时刻,只能使用一半,内存使用率较低

说一下JVM中的分代回收

堆的区域划分

在java8中,堆被分为两份:新生代和老年代(1:2)

image-20250217220820817

分代回收算法的工作机制/回收策略

  • 新创建的对象,都会先分配到eden区
  • 当伊甸园内存不足,标记伊甸园与from(现阶段没有)的存活对象
  • 将存活对象采用复制算法复制到to中,复制完毕后,伊甸园和from内存都得到释放
  • 经过一段时间后伊甸园的内存又出现不足,标记eden区域和to区存活的对象,将存活的对象复制到from区
  • 当幸存区对象熬过几次回收(最多15次),晋升到老年代(幸存区内存不足或大对象会导致提前晋升)

MinorGC、Mixed GC、FullGC的区别是什么

  • MinorGC(young GC):发生在新生代的垃圾回收,暂停时间短(STW)
  • Mixed GC:新生代+老年代部分区域的垃圾回收,G1收集器特有
  • FullGC:新生代+老年代完整垃圾回收,暂停时间长(STW),应尽力避免,一般发生在新生代和老年代内存严重不足时

名称解释STW(Stop-The-World):暂停所有应用程序线程,等待垃圾回收的完成。

说一下JVM有哪些垃圾回收器

在jvm中,实现了多种垃圾收集器,包括:

  • 串行垃圾收集器

    image-20250217222218640

  • 并行垃圾收集器

    image-20250217222316550

  • CMS(并发)垃圾收集器

    image-20250217222516085

    初始标记与GC Root相连的,并发标记其他间接连接的,重新标记发生变化的。优点:时间短、效率高。

  • G1垃圾收集器:作用在新生代和老年代

详细聊一下G1垃圾回收器

  • 应用于新生代和老年代,在JDK9之后默认使用G1

  • 划分成多个区域,每个区域都可以充当eden、survivor、old、humongous(巨型对象区),其中humongous专为大对象准备

  • 采用复制算法

  • 响应时间与吞吐量兼顾

  • 分为三个阶段:新生代回收、并发标记、混合收集

    image-20250217224126790
  • 如果并发失败(即回收速度赶不上创建新对象速度),会触发Full GC

Young Collection(年轻代垃圾回收)

  • 初始时,所有区域都处于空闲状态
  • 创建了一些对象,挑出一些空闲区域作为伊甸园区存储这些对象
  • 当伊甸园需要垃圾回收时,挑出一个空闲区域作为幸存区,用复制算法复制存活对象,需要暂停用户线程
  • 随着时间流逝,伊甸园的内存又有不足
  • 将伊甸园以及之前幸存区中的存活对象,采用复制算法,复制到新的幸存区,其中较老对象晋升至老年代

Young Collection + Concurrent Mark(年轻代垃圾回收 + 并发标记)

  • 当老年代占用内存超过阈值(默认是45%)后,触发并发标记,这时无需暂停用户进程(并发标记之后的重新标记需要STW)
  • 并发标记之后,会有重新标记阶段解决漏标问题,此时需要暂停用户线程
  • 这些都完成后就知道了老年代有哪些存活的对象,随后进入混合收集阶段。此时不会对所有老年代区域进行回收,而是根据暂停时间目标优先回收价值高(存活对象少)的区域(这也是Gabage First名称的由来)

Mixed Collection(混合垃圾回收)

  • 混合收集阶段中,参与复制的有eden、survivor、old
  • 复制完成,内存得到释放。进入下一轮的新生代回收、并发标记、混合收集

扩展

如果一个对象太大了,一个区域装不下,会存储到一个巨型对象中,一个区域不够的话,会分配一个连续的区域去存储巨型对象。

强引用、软引用、弱引用、虚对象

  • 强引用:只有所有GC Roots对象都不通过强引用引用该对象,该对象才能被垃圾回收

    image-20250217230501489

  • 软引用:仅有软引用引用该对象时,在垃圾回收后,内存仍不足时会再次触发垃圾回收(当垃圾多次回收,内存仍然不够时回收软引用对象)

    image-20250217230627264

  • 弱引用:仅有弱引用引用该对象时,在垃圾回收时,无论内存是否充足,都会回收弱引用对象(只要进行垃圾回收,就会把弱引用对象回收)

    image-20250217230810557

    image-20250217230857727

  • 虚引用:必须配合引用队列使用,被引用对象回收时,会将虚引用入队,由Reference Handler线程调用虚引用相关方法释放直接内存

    image-20250217231154459

    软引用和弱引用也可以通过引用队列去释放自身的资源

JVM实战

JVM调优的参数可以在哪里设置

  • war包部署,在tomcat中设置

    • 修改TOMCAT_HOME/bin/catalina.sh文件

      image-20250220112341929

  • jar包部署,在启动参数设置

    • 通常在linux系统下直接加参数启动SpringBoot项目

      • java -Xms512m -Xmx1024m -jar xxxx.jar

      image-20250220112445113

      nohup:用于在系统后台不挂断地运行命令,退出终端不会影响程序的运行

      参数&:让命令在后台执行,终端退出后命令仍然执行

用的JVM调优的参数都有哪些

对于JVM调优,主要就是调整年轻代、老年代、元空间的内存空间大小及使用的垃圾回收器类型。

  • 设置堆空间的大小
    • 设置堆的初始大小和最大大小,为了防止垃圾收集器在初始大小、最大大小之间收缩堆而产生额外的时间,通常把最大、初始大小设置成相同的值
    • -Xms:设置堆的初始化大小
    • -Xmx:设置堆的最大大小
    • image-20250221145608743
    • 堆空间设置多少合适?
      • 最大大小的默认值是物理内存的1/4,初始大小是物理内存的1/64
      • 堆太小,可能会频繁的导致年轻代和老年代的垃圾回收,会产生stw,暂停用户进程
      • 堆内存大肯定是好的,存在风险,假如发生了fullGC,它会扫描整个堆空间,暂停用户线程的时间特别长
      • 设置参考推荐:尽量大,也要考察一下当前计算机其他程序的内存使用情况
  • 虚拟机栈的设置
    • 每个线程默认会开启1M的内存,用于存放栈帧、调用参数、局部变量等,但一般256k就够用。通常减少每个线程的堆栈,可以产生更多的线程,但这实际上还受限于操作系统。
    • -Xss:对每个线程stack大小的调整。-Xss128k
  • 年轻代中Eden区和两个Survivor区的大小比例
    • 默认为8:1:1。通过增大Eden区的大小来减少YGC发生的次数,但有时虽然次数减少,但Eden区满的时候,由于占用的空间较大,导致释放缓慢,此时STW的时间较长,因此需要按照程序情况去调优。
    • image-20250221150632902
  • 年轻代晋升老年代的阈值
    • image-20250221150722128
    • 默认为15
    • 取值范围是0—15
  • 设置垃圾回收收集器
    • 通过增大吞吐量提高系统性能,可以通过设置并行垃圾回收收集器。
    • image-20250221150830843

说一下JVM调优的工具

  • 命令工具

    image-20250221154235750 image-20250221155739277

    image-20250221155832498

    image-20250221155935148

  • 可视化工具

    image-20250221154253575

    image-20250221160053981image-20250221160105839

Java内存泄漏的排查思路

内存泄漏通常是指堆内存,通常是指一些大对象不被回收的情况。

image-20250221160351684

image-20250221160508328

image-20250221160648244

image-20250221160811185

image-20250221160839186

image-20250221160852461

CPU飙高排查方案与思路

image-20250221161214059

image-20250221161222351

image-20250221161252299

第三步中拿到的进程是十进制,第四步中展示的是十六进制,需要进行进制转换。