JVM内存结构
1、java源码编译成java字节码
2、整体内存结构
一、 类的加载过程
内存图
第一阶段:loading
- 通过类的全限定名获取定义此类的二进制文件流
- 静态存储结构转化为方法区的运行时数据结构
- 在内存中生成一个代表这个类的java.lang.Class对象。作为方法区这个类的各种数据的访问入口
第二阶段:linking
1、验证
- class文件的字节流信息符合虚拟机要求,
- 文件格式、元数据、字节码、符号引用验证
2、准备
- 为类变量分配内存并且设置该类变量的默认初始值。
- final static 修饰的变量(常量),在编译的时候就分配,准备阶段会显示初始化
- 类变量会分配到方法区中,实例变量随着对象一起分配到堆中
3、解析
- 解析在初始化之后进行
第三阶段:initialization
- 初始化就是执行类构造器方法的过程
- javac编译器自动收集类中的所有类变量的赋值动作和静态代码块中的语句合并而来。(比如静态变量设置为1,静态代码块为改变量赋值5。最终改变量的值为5)
- 父类的静态代码块–>子类的静态代码块–>父类的构造块–>父类的构造函数–>子类的构造块–>子类的构造函数
二、类加载器(双亲委派机制)
三、沙箱安全机制
自定义String类,但是在加载自定义String类的时候会率先使用引导类加载器加载,二引导类加载器在加载的过程中会先加载jdk自带的文件(rt.jar包中java\lang\String\lang),可以保证对java核心源代码的保护。
四、程序计数器
介绍:
- 很小的内存空间,运行最快的区域
- 每个线程都有一个自己的程序计数器,线程私有,生命周期和线程生命周期一致
- 任何时间,一个线程都只有一个方法在执行,当前方法。程序计数器存储当前线程正在执行的java方法的jvm指令地址
作用:pc寄存器用来存储指令指向下一条指令的地址,由执行引擎读取下一条指令
图
两个常见的问题
1、使用PC寄存器存储字节码指令地址有什么用呢?
为什么使用PC寄存器记录当前线程的执行地址呢?
答:因为CPU需要不停的切换各个线程,这时候切换回来以后需要知道从哪开始继续执行。JVM的字节码解释器就需要知道通过改变PC寄存器的值来明确下一条应该执行什么样的字节码指令。
2、PC寄存器为什么会被设定为线程私有?
多线程是在一个特定的时间段只会执行其中某一个线程的方法,CPU会不停的切换线程,会导致经常中断或恢复,为了能够准确的记录各个线程正在执行的当前字节码指令地址,最好的方法就是为每个线程都分配一个PC寄存器。线程之间独立计算,不会出现相互干扰的情况
内存中的栈与堆
栈是运行时的单位,堆是存储的单位
栈解决程序的运行问题,程序如何执行,如何处理数据
堆是解决数据的存储问题,数据怎么放、放哪里
五、java栈
java虚拟机栈是什么?
- 早期也叫java栈。每个线程在创建的时候都会有一个虚拟机栈,内部保存一个个的栈针,对应着一次次的方法调用。
生命周期
- 生命周期和线程一致
作用
- 主观java程序运行、保存方法的局部变量(8种基本类型,对象的引用地址)、部分结果,参与方法的调用和返回
优点:
- 访问速度快,速度仅次于程序计数器
- 进栈和出栈
- 不存在gc
- 存在oom
栈中可能存在的异常
java虚拟机规范允许java栈的大小是动态的或者是固定不变的
- 如果采用固定大小的java虚拟机栈,每一个线程的java虚拟机栈容量在线程创建的时候选定,如果线程请求分配的栈容量超过java虚拟机栈允许的最大容量,抛出StackOverFlowError异常
- 如果java虚拟机栈可以动态扩展,并且在尝试扩展的时候无法申请到足够的内存,或者在创建新的线程时没有足够的内存去创建对应的虚拟机栈,抛出OutOfMemoryError异常
栈执行原理:
- 不同线程中包含的栈针是不允许存在相互引用。不可能在一个栈针中引用另外一个线程的栈针
- 如果当前方法调用了其他的方法,方法返回之迹,当前栈针会传回此方法的执行结果给前一个栈针,接着、虚拟接丢弃当前栈针,使前一个栈针变为当前栈针
- 方法的返回方式分为两种:1、正常结束,以return为代表。2、方法执行中出现未捕获的异常,以抛出异常的方式
栈帧
栈帧是一个内存区块,是一个数据集,维系着方法执行过程中的各种数据信息。
- 局部变量表
- 操作数栈
- 动态链接(指向运行时常量池的方法 引用)
- 方法返回地址(方法正常退出、异常退出的定义)
- 一些附加信息
1、局部变量表
- 又称为局部变量数组或本地变量表
- 定义为一个数字数组,主要用于存储方法参数和定义在方法体内的局部变量,数据类型包括基本数据类型、对象引用、
- 局部变量表建立在线程的栈上,线程私有,不存在数据安全问题
- 容量大小是在编译时期确定下来的。运行时不变
2、操作数栈
- 在方法执行过程中,根据字节码指令,往栈中写入数据或提取数据,入栈(push)/出栈(pop)
- 将某些字节码指令压入操作数栈,其余的字节码指令将操作数取出栈,使用后把结果压入栈。
例如:执行复制、交换、求和 - 如果被调用的方法带有返回值类型,其返回值类型将会被压入当前栈帧的操作数栈中,并且更新PC寄存器中下一条需要执行的字节码指令。
- 主要用于保存计算过程的中间结果,同时作为计算过程中变量临时的存储空间。(方法中的变量首先进入操作数栈,然后进入局部变量表。然后PC寄存器指向下一条指令,然后继续入栈,然后进入局部变量表…)
3、动态链接(或运行时常量池的方法引用)
- 每一个栈帧都包含一个指向运行时常量池中该栈帧所属方法的引用
- 在java源文件被编译到字节码文件中时,所有的变量和方法引用都作为符号引用保存在class文件的常量池里。例如:一个方法调用另外一个方法,就通过常量池中指向方法的符号哦引用来表示,动态链接的作用就是为了将这些符号引用转换为调用方法的直接引用
4、方法返回地址
- 存放调用该方法的PC寄存器地址的值
- 一个方法的结束,两种方式,正常执行完结束。出现未处理的异常,非正常退出
- 退出后,都会回到该方法被调用的位置。方法正常退出,调用者的PC寄存器的值作为返回地址,就是调用该方法的指令的下一条指令的地址。异常退出,返回地址是异常表,栈帧不保存。
方法的调用:虚方法、非虚方法
非虚方法:在编译器就确定了具体的调用版本,在运行时不可变。静态方法、final方法、实例构造器
、父类方法
六、java堆
七、本地方法
- 简单讲,一个Native Method 就是一个java调用非java代码的接口。
为什么要使用Native Method?
- 1、与java环境外交互(有时java应用需要与java外面的环境交互,这是本地方法存在的主要原因)
- 2、与操作系统交互(通过使用本地方法,我们得以用java实现了jre的与底层系统的交互,甚至jvm的一部分就是用c写的)
- 3、sun’s java (sun的解释器就是用c来实现的,使得它能像一些普通的从一样与外部交互)
八、本地方法栈
- java虚拟机栈用来管理java方法的调用,本地方法栈用来管理本地方法的调用
- 线程私有
- 允许被实现成固定或者是可动态扩展的内存大小(在内存溢出方面和java栈是相同的)
- 本地方法是使用c语言实现的
- 具体做法是Native Method Stack中登记native方法,在Excution Engine执行时加载本地方法库