Java 虚拟机 一
[TOC]
Java虚拟机
Java内存区域 与 内存溢出 异常
一、 运行时数据区域
1. 程序计数器
程序计数器(Program Counter Register)是一块较小的内存空间,可以看作是当前线程所执行的字节码的行号指示器。
每个线程都有独立的程序计数器,各个线程之间计数器互不影响,独立存储线程私有内存
- 线程正在执
行一个Java方法,计数器记录的是正在执行的虚拟机字节码指令的地址 - 如果正在执行一个
native方法,这个计数器 为 空(undefined)
2. Java虚拟栈
Java虚拟栈(Java Virtual Machine Stacks)
也是线程私有的,它的生命周期和线程相同。虚拟机栈描述的是Java方法执行的内存模型:每个方法在执行的同时都会创建一个栈帧(Stack Frame)用于存储局部变量表、操作数栈、动态链接、方法出口等信息。每个方法从调用直到执行完成的过程,就对应一个栈帧在虚拟机栈中入栈到出栈的过程。
3. 本地 方法栈
本地方法栈(native method stack)与
Java虚拟机栈所发挥的作用是非常相似的,它们之间的区别是Java虚拟机栈 为虚拟机执行Java方法(字节码)服务,本地方法栈 为虚拟机使用到的native方法 服务。
4. Java堆
Java堆(Java Heap)是Java虚拟机所管理的内存中最大的一块。 Java堆是被
所有线程共享的一块内存区域,在虚拟机启动时创建。目的:存放对象实例,几乎所有的对象实例都在这里分配内存。所有的对象实例以及数组都要在堆上分配,但是随着 JIT 编辑器的发展与逃逸分析技术逐渐成熟,栈上分配、标量替换 优化技术将会导致一些微妙变化发生,所有对象都分配在堆上也渐渐变得 不是 那么
绝对了
Java堆 是垃圾收集器管理的主要区域,很多时候被成为 GC堆(Garbage Collected Heap)
从内存回收的角度看,由于现在收集器基本都采用分代收集算法
- 新生代
- 老年代
从内存分配的角度来看,线程共享的Java堆中可能划分出多个线程私有的分配缓冲区(Thread Local Allocation Buffer,TLAB)
Java堆只要在逻辑上连续即可,不一定要物理上连续。在实现时候,是可以扩展的(通过-Xmx 和 -Xms 控制)。如果在堆上没有内存完成实例分配,而且堆也无法拓展时 就会抛出 OutOfMemoryError异常
5. 方法区
方法区(Method Area)与Java堆一样,是各个线程共享的内存区域,它用于
存储已被虚拟机加载的类信息、常量、静态变量、即时编译器 编译后的代码数据。别名(非堆 用来区分Java堆区)
JDK1.7 的 HotSpot 字符串常量池 移出 永久代
Java虚拟机规范 对 方法区的限制非常宽松,在方法区 很少进行垃圾收集,内存回收目标 主要是针对常量池的回收和堆对类型的卸载
6. 运行时常量池
运行时常量池(Runtime Constant Pool)是方法区的一部分。Class 文件中除了类的
版本、字段、方法、接口等描述的信息外,还有一项信息是常量池(Constant Pool Table)用于存放编译器生成的各种字面量和符号引用,这部分内容将在类加载后进入方法区运行时常量池里存放。运行时常量池 相对于Class文件常量池的另外一个重要特征是具备动态性,Java语言并不要求常量一定只有编译期才能产生,运行期间也可能将新的常量放入池中,
例:String 类 的intern() 方法
运行时常量池是方法区的一部分,自然受到方法区的限制,当常量池无法再申请到内存的时就会抛出 OutOfMemoryError 异常。
7. 直接内存
直接内存(Direct Memory)不是
虚拟机运行时候数据区的一部分,也不是Java虚拟机规范中定义的内存区域。 在JDK1.4 中新加入的NIO(New Input/Output)类,引入了一种基于通道(Channel)和缓存区(Buffer)的 I/O 方式,它可以使用Native函数库直接分配堆外内存,
然后通过一个存储在Java堆中的DirectByteBuffer对象作为这块内存的引用进行操作。这样就能在一些场景中显著提高性能,来避免在Java堆 和 Native堆中来回复制数据。 本机直接内存的分配不会受到Java堆大小的限制。但是,既然是内存,肯定还是会受到本机总内存(包括RAM 以及 SWAP区 或者分页文件)大小以及处理器寻址的限制。
二、HotSpot 虚拟机对象探秘
这里会介绍 虚拟机内存中的数据的其他细节,比如 它们是如何创建、如何布局 以及 如何访问的,这里探讨HotSpot 虚拟机 在Java堆中 对象分配、布局 和 访问 的全过程。
1. 对象的创建
类加载检查
虚拟机遇到一条 new 指令时,首先将去检查这个
指令的参数是否能在常量池中定位到一个类的符号引用,并且检查这个符号引用代表的类是否已经被加载、解析和初始化过。如果没有,那必须先执行相应的类加载过程。检查是否创建过,创建过直接使用引用,没创建 执行类加载过程
虚拟机为新生对象分配内存
在
类加载检查后(也就是确保类已经生成了),在类加载完成后已经确定了 要创建对象所需要的内存的大小是多少。两种情况:
Java堆绝对规整
指针碰撞 已用和空闲 中间放着一个指针作为分界点
Java堆不规整
空闲列表 虚拟机维护一个列表,记录哪些内存可以使用
考虑虚拟机创建是否频繁行为
两种解决方案:
对分配内存空间的动作进行同步处理 实际上虚拟机采用
CAS配上失败重试的方式保证更新操作的原子性把内存分配的动作按照线程划分在不同的空间之中进行,即 每个线程在Java堆中预先分配一小块内存,称为
本地线程分配缓冲(Thread Local Allocation Buffer,TLAB)。哪个线程要分配内存,就在哪个线程的TLAB上分配,只有TLAB用完分配新的TLAB时,才需要同步锁定。虚拟机是否使用TLAB:通过 -XX:+/-UseTLAB
内存分配完后,虚拟机将分配到的内存空间都初始化为零值(不包括对象头)
如果使用 TLAB,在TLAB分配前进行。
(保证对象的实例字段在Java代码中可以不赋值就可以直接使用,程序访问到这些字段的数据类型所对应的 零值)虚拟机对对象进行必要的设置
对象信息头(Object Header)中:对象是哪个类实例、如何才能找到类的元数据信息、对象的哈希码、对象的GC分代年龄
到这里位置
从虚拟机的角度看 已经产生一个新的对象产生了,
从Java程序的视角看 对象创建才刚开始
2. 对象的内存布局
HotSpot 中,对象在内存中存储布局分为 3 块区域:对象头(Header)、实例数据(Instance Data)、对齐填充(Padding)
对象头
对象头包括两部分信息,
第一部分用于存储对象自身的运行时数据,哈希码(Hash Code)、GC分代年龄、锁状态、线程持有锁、偏向线程ID、偏向时间戳,这部分长度32bit(32位虚拟机)或64bit(64位虚拟机)
官方称作 -> Mark Word Mark Word被设计城一个
非固定的数据结构以便在极小的空间内存存储尽量多的信息,它会根据对象的状态复用自己的存储空间。

第二部分 是类型指针,即对象指向它的类 元数据的指针,虚拟机根据指针确定对象是哪个类实例。
但是 并不是所有的虚拟机实现都必须在对象数据上保留类型指针
实例数据
实例数据部分是
对象真正的存储的有效信息,也是在程序代码中所定义的各种类型的字段内容。这部分的存储顺序会受到虚拟机分配策略参数 和 字段在Java源码中定义顺序影响。 HotSpot虚拟机默认的分配策略为 longs/doubles 、ints、shorts/chars、bytes/booleans、oop(Ordinary Object Pointers),从
分配策略中可以看出,相同宽度字段总是分配到一起。 在满足这个前提条件下,
父类中定义的变量会出现在子类之前,如果CompactField 参数值 为 true(默认为true),子类中较窄的变量也可能插入父类变量的空隙中。
对齐填充
对齐填充并不是必然存在的,也没有特别的含义,它仅仅起着占位符的作用。由于HotSpot VM的自动内存管理系统要求对象起始地址必须是8字节的整数倍,换句话说,就是对象的大小必须是8字节的整数倍。
而对象头部分正好是8字节的倍数(1倍或者2倍),因此,当
对象实例数据部分没有对齐时,就需要通过对齐填充来补全。
3. 对象的访问定位
创建对象是为了使用对象,Java程序通过 栈上的reference 数据来操作堆上的具体对象。由于 reference类型在Java虚拟机规范中只规定了一个指向对象的引用,但是没有定义通过何种方式去定位
目前主流的指针访问方式 有使用 句柄 和 直接指针 两种。
使用句柄访问
image.B2MIH0
使用句柄访问,
Java堆中将会划分出一块内存来作为句柄,reference 中存储的就是对象的句柄地址,句柄中包含了对象实例数据与类型数据各自的具体地址信息使用直接指针访问
使用直接指针访问,那么Java堆对象的布局中就必须考虑如何放置访问类型数据的相关信息,reference 中存储的直接就是对象地址

小结:
两种访问方式各有优势
句柄访问最大的好处 reference中存储稳定的句柄地址,在对象被移动(垃圾收集时移动对象)时 只会改变句柄中的实例数据指针,而 reference本身不需要修改
直接指针访问 最大的好处是 速度更快,节省了一次指针定位的时间开销,由于对象的访问在Java中频繁, 这种开销积少成多后是非常客观的
HotSpot 是采用直接指针方式进行对象访问,但是各种语言和框架使用句柄的情况也很常见
三、实战:OutOfMemoryError 异常
在 Java虚拟机规范中,除了程序计数器外,虚拟机内存的其他几个运行时 区域都有发生 OutOfMemoryError(OOM)
第一:通过代码验证Java虚拟机规范中描述的各个运行时 区域存储的内容
第二:在工作中遇到实际的内存溢出异常时,能根据异常的信息快速,判断是哪个区域的内存溢出,知道什么样的代码可能会导致这些区域内存溢出,以及出现这些异常后该如何处理。
1. Java堆溢出
Java堆 用于存储对象实例,只要不断地创建对象并且保证GC Roots 到对象之间有可达路径来避免垃圾回收机制清除这些对象,在对象数量到达最大堆容量限制后就会产生产生内存溢出异常。
Java堆 将堆的最小值-Xms参数与最大值-Xmx参数设置为一样即可避免堆自动扩展
-XX:+HeapDumpOnOutOfMemoryError 可以让虚拟机在出现内存溢出异常时Dump出当前的内存堆转储快照以便事后进行分析
2. 虚拟机栈 和 本地方法栈溢出
由于在HotSpot 虚拟机中并不区分 虚拟机栈 和 本地方法栈
如果线程请求的栈深度大于 虚拟机所允许的最大深度,抛出 StackOverflowError 异常
如果虚拟机在扩展时无法申请到足够的内存空间,抛出 StackOverflowError 异常
当栈空间无法继续分配时,本质上就是栈空间使用太大,导致的内存太小
-Xss 参数减少栈 内存容量
3. 方法区 和 运行时常量池 溢出
-XX: PermSize=10m
-XX: MaxPermSize=10m
-XX:PermSize和-XX:MaxPermSize限制方法区大小,从而间接限制其中常量池的容量
4. 本机直接内存溢出
DirectMemory 容量 可以通过 -XX: MaxDirectMemorySize 指定,如果不指定默认和Java堆最大堆一样
- 本文作者:Jun
- 本文链接:http://mambajun.github.io/2020/03/05/Java%20%E8%99%9A%E6%8B%9F%E6%9C%BA%20%E4%B8%80/index.html
- 版权声明:本博客所有文章均采用 BY-NC-SA 许可协议,转载请注明出处!


