Class字节码指令解释执行

JVM指令主要包含了一下几种类型:加载和存储指令、运算指令、类型转换指令、对象创建与访问指令、操作数栈管理指令、控制转移指令、方法调用和返回指令、异常处理指令、同步指令等。

基于栈的解释器执行过程

下面看一下一个简单的代码片段,如下所示:

public class StackTest {

	public int calc() {
		int a = 100;
		int b = 200;
		int c = 300;
		return (a + b) * c;
	}

}

通过jclasslib工具或者javap -verbose命令,可以得到calc()方法的字节码指令。如下所示:

 0 bipush 100
 2 istore_1
 3 sipush 200
 6 istore_2
 7 sipush 300
10 istore_3
11 iload_1
12 iload_2
13 iadd
14 iload_3
15 imul
16 ireturn

下面来具体的说明一下整个方法的执行过程:

上面的指令执行过程只是一个概念模型,JVM会对过程做一些优化来提高性能,JVM在实际运行时可能执行过程差距比较大,并且不同虚拟机的执行也不尽相同。

加载和存储指令

加载和存储指令用于数据在栈帧中的局部变量表和操作数栈之间的来回传输。

将一个局部变量加载到操作数栈:iload、iload_、lload、lload_、fload、fload_、dload、dload、aload、aload。

将一个数值从操作数栈存储到局部变量表:istore、istore_、lstore、lstore_、fstore、fstore_、dstore、dstore_、astore、astore_。

将一个常量加载到操作数栈:bipush、sipush、ldc、ldc_w、ldc2_w、aconst_null、iconst_ml、iconst_、lconst_、fconst_、dconst_。

扩充局部变量表的访问索引的指令:wide。

运算指令

运算指令作用于操作数栈上面的2个值的特定运算,并且把结果重新存入操作数栈顶。大体上可以分为2类:对整型、浮点型数值运算。因为JVM指令集中没有byte、short、char和boolean类型的算术运算,所以都使用了对应的int类型的指令代替。

加法指令:iadd、ladd、fadd、dadd

减法指令:isub、lsub、fsub、dsub

乘法指令:imul、lmul、fmul、dmul

除法指令:idiv、ldiv、fdiv、ddiv

求余指令:irem、lrem、frem、drem

取反指令:ineg、lneg、fneg、dneg

位移指令:ishl、ishr、iushr、lshl、lshr、lushr

按位或指令:ior、lor

按位与指令:iand、land

按位异或指令:ixor、lxor

局部变量自增指令:iinc

比较指令:dcmpg、dcmpl、fcmpg、fcmpl、lcmp

类型转换指令

类型转换指令可以将2种不同类型的数值相互转换,这些转换一般实现于代码中的显示类型转换,主要有以下类型:

int类型到long、float或者double类型

long类型到float、double类型

float类型到double类型

对于显示的类型转换,一般情况下都是窄化类型转换(也就是丢失精度的转化,如:long转为int等)。常见的转换指令有:i2b、i2c、i2s、l2i、f2i、f2l、d2i、d2l、d2f等。

对象创建与访问指令

对于普通对象和数组的创建,JVM分别使用了不同的指令去处理。

创建普通对象的指令:new

创建数组的指令:newarray、anewarray、multianewarray

访问类变量(static类型)和实例变量(非static类型)的指令:getstatic、putstatic、getfield、putfield

把一个数组加载到操作数栈的指令:baload、caload、saload、iaload、laload、faload、daload、aaload

将一个操作数栈的值存储到数组元素中的指令:bastore、castore、sastore、iastore、fastore、dastore、aastore

取数组长度的指令:arraylength

检查普通对象类型的指令:instanceof、checkcast

操作数栈管理指令

如同一个普通的堆栈一样,JVM提供了直接操作操作数栈的指令。

将操作数栈顶的1个或2个元素出栈:pop1、pop2

复制栈顶1个或2个元素,并将副本的1份或者2份重新入栈:dup、dup2、dup_x1、dup2_x1、dup_x2、dup2_x2

将栈顶的两个数值互换:swap

控制转移指令

控制转移指令可以让JVM,跳转到指定的偏移地址的字节码执行。从上面的模型图看来,就是修改程序计数器的值。

分支条件:ifeq、iflt、ifle、ifne、ifgt、ifge、ifnull、ifnonnull、if_icmpeq、if_icmpne、if_icmplt、if_icmpgt、if_icmple、if_icmpge、if_acmpeq、if_acmpne。

复合条件分支:tableswitch、lookupswitch

无条件分支:goto、goto_w、jsr、jsr_w、ret。

方法调用和返回指令

方法调用包含了以下指令。

invokevirtual指令:用于调用对象的实例方法,根据对象的实际类型分派(虚方法分派)。

invokeinterface指令:用于调用接口方法,它会在运行时搜索一个实现这个接口的对象,找出合适的方法调用。

invokespecial指令:用于调用一些需要特殊处理的实例方法,包括初始化方法、私有方法、父类方法。

invokestatic指令:用于调用类方法(static方法)。

invokedynamic指令:用于在运行时动态解析出调用点限定符所引用的方法,并执行。

上述的前4条指令都是固化在JVM内部的,invokedynamic的分派逻辑是由用户所设定的引导方法决定的。

方法的调用指令与数据类型无关,而方法的返回指令是根据返回值区分的。包括:ireturn(当返回值是boolean、byte、char、short、int)、lreturn、freturn、dreturn和areturn。return指令提供给:返回值为void的指令、实例方法初始化、接口类方法初始化。

异常处理指令

Java程序中显示抛出异常的操作都是由athrow指令实现的。

同步指令

JVM可以支持方法级的同步和方法内的同步,这两种同步结构都是由管程(Monitor)来实现的。

方法级的同步是隐式的,无需通过字节码指令来控制。JVM可以从方法常量池的方法表结构中的ACC_SYNCHRONIZED访问标志,得到其是否为同步方法。

对于方法中的同步块,JVM中使用monitorenter和monitorexit两条指令来支持。下面参见一个代码清单:

public class SyncInstruction {
	
	void onlyMe(Object f) {
		synchronized (f) {
			System.out.println("synchronized control.");
		}
	}

}

对应的指令序列如下:

 0 aload_1		    // 将对象f入栈
 1 dup				// 复制栈顶元素(即f的引用)
 2 astore_2		    // 将栈顶元素存储到局变量表Slot 2中
 3 monitorenter		// 以栈顶元素(f)作为锁,开始同步
 4 getstatic #2 <java/lang/System.out>		// 访问System的静态属性out
 7 ldc #3 <synchronized control.>		// 将字符串常量"synchronized control."压入操作数栈顶
 9 invokevirtual #4 <java/io/PrintStream.println>		// 调用PrintStream.println()方法
12 aload_2		// 将局部变量表Slot 2的元素(f)入栈
13 monitorexit	// 退出同步
14 goto 22 (+8)	// 方法正常退出,跳转到22行
17 astore_3		// 这里开始是异常路径,它的偏移量记录在异常表中,如下图所示
18 aload_2		// 将局部变量表Slot 2的元素(f)入栈
19 monitorexit	// 退出同步
20 aload_3		// 将局变量表Slot 3的元素(异常对象)入栈
21 athrow		// 把异常重新抛出给onlyMe()方法的调用者
22 return		// 方法正常返回

异常表如下所示:


参考:《深入理解Java虚拟机》