垃圾收集与几种常用的垃圾收集算法

  首先思考垃圾收集(Garbage Collection,GC)需要完成的三件事情

  1)哪些内存需要回收?

  2)什么时候回收?

  3)如何回收?

  在上一个博客中提到了Java内存运行时区域的各个部分,其中程序计数器、虚拟机栈、本地方法栈3个区域会随着线程而生,随线程而灭;栈中的栈帧随着方法的进行有条不紊地执行着出栈和入栈操作。每一个栈帧中分配多少内存基本上是在类结构确定下来时就已知得,因此这几个区域的内存分配回收都具备确定性,在这几个区域就不需要过多的考虑回收的问题,因为在方法结束或线程结束时内存就被回收了。而Java堆和方法区则不一样,一个接口中的实现类需要的内存可能不一样,一个方法中的多个分支需要的内存也可能不一样,我们只有在程序处于运行期间才能知道会创建那些对象,这部分内存的分配和回收都是动态的,垃圾收集器所关注的是这部分内存。

 一、对象已死

  1.所谓对象已死,其实就是垃圾收集器在对堆进行回收之前需要判断这些对象中哪些还“存活着”,哪些已经“死去”

  2.判断算法

    1)引用计数法(Reference Counting):许多教科书上判断对象是否存活都是这个算法,但是在主流的Java虚拟机里没有选用这个算法来管理内存,下面来简单介绍一下此算法,其实就是为对象中添加一个引用计数器,每当一个地方引用它时,计数器就加1;当引用失效时,计数器就减1;任何时刻计数器为0的对象就是不可能再被使用的

    2)可达性分析算法(Reachability Analysis):在主流的商用程序语言的实现中,都是通过可达性分析法来判定对象是否存活的。这个算法的基本思路就是通过一系列的称为“GC Roots”的对象作为起始点,从这些节点开始向下搜索,搜索所走的路径称为引用链(Reference Chain),当一个对象到GC Roots没有任何引用链相连时,则证明此对象是不可用的

    

    在Java语言中,可作为GC Roots的对象包括:

      虚拟机栈(栈帧中的本地变量表)中引用的对象

      方法区中常量引用的对象

      方法区中类静态属性引用的对象

      本地方法栈中JNI(即一般说的Native方法)引用的对象

  3.引用

    其实无论通过那种算法来判断对象是否已死,判断都与“引用”有关

    Java中引用可分为强引用、软引用、弱引用、虚引用四种,这4中引用强度一次降低

      1)强引用:程序间普遍存在的,类似“Object obj = new Object()”这类引用,只要强引用还存在,垃圾收集器就永远不会回收掉被引用的对象

      2)软引用:用来描述一些还有用但并非必须的对象。对于软引用关联的对象,在系统将要发生内存溢出异常之前,将会把这些对象列进回收范围之中进行第二次回收。如果这次回收还没有足够的内存,才会抛出内存溢出异常

      3)弱引用:也是用来描述非必须对象的,但是它的强度比软引用更弱一些,被弱引用关联的对象只能生存到下一次垃圾收集发生之前。当垃圾收集器工作时,无论当前内存是否足够,都会回收掉被弱引用关联的对象

      4)虚引用:也成为幽灵引用或者欢迎引用,它是最弱的一种引用关系。一个对象是否具有虚引用的存在,完全不会对其生存时间构成影响,也无法通过虚引用来取得一个对象实例

 二、垃圾收集算法

  1.标记-清除算法

    最基本的收集算法“标记-清除”(Mark-Sweep)算法,算法分为“标记”和“清除”两个阶段:首先标记出所有需要回收的对象,在标记完成后统一回收所有被标记的对象,之所以说它是最基本的收集算法,是因为后续的收集算法都是基于这种思路并对其不足进行改进而得到的。它的主要不足有两个:

    一是效率问题,标记和清除效率都不高,二是空间问题,标记清除后会产生大量不连续的内存碎片,空间碎片太多可能会导致以后程序在运行过程中需要分配较大对象时,无法找到足够的连续内存而不得不提前触发另一次垃圾收集动作

    执行过程如下图:

    

  2.复制算法

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/fab7ffa1e1bab5db5ae2ae6e35a9a71b.html