A-A+

class文件常量池和运行时常量池比对

2016年07月21日 Java 暂无评论阅读 2,574 views 次

在学习JVM过程中，接触到常量池这个概念，后来发现不仅仅有一个运行时常量池概念，还有一个class文件常量池概念，使得本来不懂的我更加迷惑了。要想理解，那么就得对这两者进行比较理解，加深记忆。

那么，我们先看一下JVM运行时数据区：

Java虚拟机的基本结构

其中，

程序计数器（PC计数器）：是JVM执行程序的流水线，存放一些跳转指令。

本地方法栈：是JVM调用操作系统方法所使用的栈。

虚拟机栈：是JVM调用Java代码所使用的栈。

方法区：存放一些常量、静态变量、类信息等，可以理解成class文件在内存中的存放位置。

虚拟机堆：是JVM执行Java代码所使用的堆。

那么，我们要了解的Java常量池实际上分为两种形态：静态常量池（class文件常量池）和运行时常量池。

所谓静态常量池，即*.class文件中的常量池，class文件中的常量池不仅仅包含字符串（数字）字面量，还包括类、方法的信息，占用class文件绝大部分空间。

而运行时常量池，则是JVM虚拟机在完成类装载操作后，将class文件中的常量池载入带内存中，并保存在方法区中，我们常说的常量池就是值方法区中的运行时常量池。

实例

String s1 = "Hello";
String s2 = "Hello";
String s3 = "Hel" + "lo";
String s4 = "Hel" + new String("lo");
String s5 = new String("Hello");
String s6 = s5.intern();
String s7 = "H";
String s8 = "ello";
String s9 = s7 + s8;
System.out.println(s1 == s2); // true
System.out.println(s1 == s3); // true
System.out.println(s1 == s4); // false
System.out.println(s1 == s9); // false
System.out.println(s4 == s5); // false
System.out.println(s1 == s6); // true

下面对上述例子进行相关说明，我们都知道在Java中，直接使用==操作符，比较的是两个字符串的引用地址，并不是比较字符串的值（内容），如果比较呢内容则使用String.equals()方法。

s1==s2这个非常好理解，s1、s2在赋值的时候，均使用的是字符串字面量，也就是说直接把字符串写死，在编译期间，这种字面量会直接放入class文件的常量池中，从而实现复用，载入运行时常量池后，s1、s2指向的是同一个内存地址，所以相等。

s1==s3是一个坑s3虽然是动态拼接出来的字符串，但是所有参加拼接的部分都是已知的字面量，在编译期间，这种拼接会被优化，编译器直接帮你拼接好，因此String s3 = “Hel”+“lo”;在class文件中被优化成String s3="Hello";所以s1 == s3成立。

s1==s4当然不相等，s4虽然也是拼接出来的，但是new String("lo")这部分不是已知字面量，是一个不可预料的部分，编译器不会进行优化，必须等到运行时才可以确定结果，结合字符串不变定理，不知道s4会被分配到那里去了，所以地址肯定不同。

String1

s1==s9也不相等，道理差不多，虽然s7、s8在赋值的时候使用的字符串字面量，但是拼接成s9的时候，s7、s8作为两个变量，都是不可预料的，编译器毕竟是编译器，不可能当解释器用，所以不做优化，等到运行时，s7、s8拼接成的新字符串，在堆中地址不确定，不可能与方法区常量池中的s1地址相同。

String2

s4==s5已经不用解释了，绝对不相等，二者都在堆中，但地址不同。

s1==s6这两个相等完全归功于intern方法，s5在堆中，内容为Hello ，intern方法会尝试将Hello字符串添加到常量池中，并返回其在常量池中的地址，因为常量池中已经有了Hello字符串，所以intern方法直接返回地址；而s1在编译期就已经指向常量池了，因此s1和s6指向同一地址，相等。

至此，我们可以得出三个非常重要的结论：

必须要关注编译期的行为才能更好地理解常量池。
运行时常量池中的常量，基本来源于各个class文件中的常量池。
程序运行时，除非手动向常量池中添加常量（比如调用intern方法），否则JVM不会自动添加常量到常量池。

以上所讲仅涉及字符串常量池，实际上还有整型常量池、浮点型常量池等等，但都大同小异，只不过数值类型的常量池不可以手动添加常量，程序启动时常量池中的常量就已经确定了，比如整型常量池中的常量范围：-128~127，只有合格范围的数字可以用到常量池。

理解

下面让我们触摸一下真正的常量池。

前面讲过，class文件中存在一个静态常量池，这个常量池是由编译器生成的，用来存储Java源文件中的字面量。

假设我们有如下Java代码：

String s1 = "Hello";

为了方便起见，就这么简单，没错！将代码编译成class文件后，用winhex打开二进制格式的class文件。如图： String3

简单讲一下class文件的结构，开头的4个字节是class文件魔数，用CA FE BA BE来标识这是一个class文件。

紧接着4个字节是Java的版本号，版本号的高低和JDK版本的高低相对应，高版本兼容低版本，但是低版本无法执行高版本。所以如果想知道别人的class文件是用什么JDK版本编译的，就可以看这4个字节。

接下来就是常量池入口，入口处用2个字节标识常量池常量数量，本例中数值为 00 1A，转换成十进制等于26，也就是说有25个常量，其中第0个常量是特殊值，所以只有25个常量。

常量池中存放了各种类型的常量，它们都有自己的类型，并且都有自己的存储规范，这里只关注字符串常量，字符串常量以01开头（1个字节），接着用2个字节记录字符串长度，然后就是字符串实际内容，本例中为：

标识长度实际内容

01 00 02 68 69

接下来再说说运行时常量池，由于运行时常量池在方法区中，我们可以通过JVM参数：-XX:PermSize、-XXMaxPermSize来设置方法区大小，从而简介限制常量池大小。

假设JVM启动参数为：-XX:PermSize＝2M -XX:MaxPermSize＝2M，然后运行如下代码：

//保持引用，防止自动垃圾回收
List<String> list = new ArrayList<String>();
int i = 0;
while(true){
//通过intern方法向常量池中手动添加常量
list.add(String.valueOf(i++).intern());
}

程序立刻会抛出：Exception in thread "main" java.lang.outOfMemoryError: PermGen space异常。PermGen space正是方法区，足以说明常量池在方法区中。

在jdk8中，移除了方法区，转而用Metaspace区域替代，所以我们需要使用新的jvm参数：-XX:MaxMetaspaceSize=2M，依然运行如上代码，抛出：java.lang.OutOfMemoryError: Metaspace异常。同理说明运行时常量池是划分在Metaspace区域中。具体关于Metaspace区域的知识，请读者自行搜索。