Android开发者性能开发简直都是面向Java/Kotlin语法编程,对于class文件的关注绝对较少。 当你反编译class文件或程序编译期批改字节码亦做代码注入时,读懂字节码成为一道绕不开的槛。
文章次要形容如何疾速读懂一个class文件。波及到的 JVM 指令及字节码构造已做了整顿,这部分常识平时用到的时候查一下便可,用多了天然记住了。即便你是一个老手,依照上面的思路整合,你也能够从 0 上手。
读完本篇文章你会播种:
- Class 文件构造长啥样
- JVM 操作指令有哪些
- 如何从二进制流中读懂 Class 文件
举个栗子???? 带你入门
编写一个简略的java文件 。
应用javac编译 TestClass.java 输入 TestClass.Class,失去的二进制流文件。能够通过工具查看其内容,在 MAC 平台上举荐应用 iHex-Hex Editor 以十六进制格局查看,大略长这个样子。
这看起来像天书,无从下手。实际上任何编程产物最终都会演化成二进制,它必然是依照某种规定来申明对应逻辑。 Java 虚拟机为了可能解析这个文件,要求其内容必须严格依照格局来排版,这种构造格局便是Class文件构造。然而单单晓得外面有哪些内容还不够,虚拟机还须要一套规定来操作这些内容,这些规定便是字节码操作指令。
要读懂这些天书,先得理解天书是怎么写进去的。
Class文件构造长啥样
java文件通过 JAVA编译器(javac)编译成中间代码字节码class文件。class文件 是一个二进制文件,外面的内容曾经是严格依照 Class 文件构造规定排列的。
上面示意是 Class 文件构造表,顺次依照行从上到下解析,也就是说文件结尾优先解析 magic(魔数)。
类型 | 名称 | 形容 | 数量 |
---|---|---|---|
u4(4个字节) | magic | 确定该文件是否为一个能被虚拟机承受的Class文件,相似于ID | 1 |
u2(2个字节) | minot_version | 次版本号 | 1 |
u2(2个字节) | mahor_version | 主版本号 | 1 |
u2(2个字节) | constant_pool_count | 常量池容量计数值,从1开始计算,0则示意不援用任何一个常量池我的项目 | 1 |
cp_info | constant_pool | 常量池 | constant_pool_count-1 |
u2(2个字节) | access_flags | 拜访标记 | 1 |
u2(2个字节) | this_class | 类索引 | 1 |
u2(2个字节) | super_class | 父类索引 | 1 |
u2(2个字节) | interfaces_count | 实现接口的数目 | 1 |
u2(4个字节) | interfaces | 接口索引 | interfaces_count |
u2(4个字节) | fields_count | 字段的数目 | 1 |
field_info | fields | 字段内容 | fields_count |
u2(2个字节) | methods_count | 办法的数目 | 1 |
method_info | methods | 办法内容 | methods_count |
u2(2个字节) | attributes_count | 属性的数目 | 1 |
attribute_info | attributes | 属性内容 | attributes_count |
单靠下面表还不够,形容列中局部内容蕴含字节码层面的形容,还需依据特定表格进行查问解析,具体如下:
- 常量池对应常量表束缚
- 拜访标记对应拜访标记表束缚
- 字段对应字段表束缚
- 办法对应办法表束缚
- 属性对应属性表束缚,同时属性内可能还须要进一步划分,对应Code属性构造, 异样属性构造等表束缚
- 还有一些非凡字符串格局束缚,比方非凡字符串表等等
常量表
常量池次要寄存两种类型
- 字面量,蕴含文本字符串,final 常量值等。
- 符号援用,类和接口的全限定名,字段的名称和描述符,办法的名称和描述符。
Class文件只保留各个办法,字段信息,不保留内存信息。只有通过运行期转换能力失去真正的内存入口。当虚拟机运行时,须要从常量池中获取到对应的符号援用,再通过类创建者运行时解析,失去具体的内存地址。
类型 | 子结构 | 标记 | 形容 |
---|---|---|---|
CONSTANT_Utf8_info | tag | u1 = 1 | UTF-8编码的字符串 |
– | lenght | u2 | UTF-8编码的字符串占用的字节数 |
– | bytes | u1 | 长度为lenght的UTF-8编码的字符串 |
CONSTANT_Integer_info | tag | u1=3 | 整型字面量 |
– | bytes | u4 | 依照高位在前存储的int值 |
CONSTANT_Float_info | tag | u1=4 | 浮点型字面量 |
– | bytes | u4 | 依照高位在前存储的float值 |
CONSTANT_Long_info | tag | u1=5 | 长整型字面量 |
– | bytes | u8 | 依照高位在前存储的long值 |
CONSTANT_Double_info | tag | u1=6 | 双精度浮点型字面量 |
– | bytes | u8 | 依照高位在前存储的double值 |
CONSTANT_Class_info | tag | u1=7 | 类或接口的符号援用 |
– | bytes | u2 | 指向全限定名常量项的索引 |
CONSTANT_String_info | tag | u1=8 | 字符串类型字面量 |
– | bytes | u2 | 指向字符串字面量的索引 |
CONSTANT_Fieldref_info | tag | u1=9 | 字段的符号援用 |
– | index | u2 | 指向申明字段的类或者接口描述符 CONSTANT_Class_info 的索引项 |
– | index | u2 | 指向申明字段的类或者接口描述符CONSTANT_NameAndType_info 的索引项 |
CONSTANT_Methodred_info | tag | u1=10 | 类中办法的符号援用 |
– | index | u2 | 指向申明字段的类或者接口描述符 CONSTANT_Class_info 的索引项 |
– | index | u2 | 指向申明字段的类或者接口描述符CONSTANT_NameAndType_info 的索引项 |
CONSTANT_InterfaceMethodref_info | tag | u1=11 | 接口中办法的符号援用 |
– | index | u2 | 指向申明字段的类或者接口描述符 CONSTANT_Class_info 的索引项 |
– | index | u2 | 指向申明字段的类或者接口描述符CONSTANT_NameAndType_info 的索引项 |
CONSTANT_NameAndType_info | tag | u1=12 | 字段或办法的局部符号援用 |
– | index | u2 | 指向该字段或办法名称常量项的索引 |
– | index | u2 | 指向该字段或办法名称常量项的索引 |
CONSTANT_MethodHandle_info | tag | u1=15 | 示意办法句柄 |
– | reference_kind | u1 | 值必须在[1,9]中,它决定了办法句柄的类型。办法句柄类型的值示意办法句柄的字节码行为 |
– | reference_index | u2 | 值必须是对常量池的无效索引 |
CONSTANT_MethodType_info | tag | u1=16 | 识别方法类型 |
– | descriptor_index | u2 | 值必须是对常量池的无效索引,常量池在该索引处的项必须是CONSTANT_Utf8_info构造,示意办法的描述符 |
CONSTANT_InvokeDynamic_info | tag | u1=18 | 示意一个动静办法调用点 |
– | bootstrap_method_attar_index | u2 | 值必须是对以后Class文件中疏导办法表的 bootstrap_methods[]数组的无效索引 |
– | name_and_type_index | u2 | 值必须是对以后常量池的无效索引,常量池在该索引处的值必须是CONSTANT_NameAndType_info构造,示意办法名和办法描述符 |
拜访标记表
针对类,字段表,办法表中的拜访标记进行划分。
-
类拜访标记,用于辨认一些类或者接口档次的访问信息, 包含这个 Class 是类还是接口,是否被定义成 public 类型,是否被定义成 abstract 类类型,如果是类的话,是否被申明为 final 等。
标记名称 标记值 形容 ACC_PUBLIC 0x0001 是否为public类型 ACC_FINAL 0x0010 是否被申明为final,只有类可设置 ACC_SUPER 0x0020 是否容许应用invokespecial字节码指令的新语意,invokespecial指令的语意在JDK1.0.2产生过变动,为了区别这条指令应用哪种语意,JDK1.0.2之后编译进去的类的这个标识必须都为真 ACC_INTERFACE 0x0200 标识这个是一个接口 ACC_ABSTRACT 0x0400 是否为abstract类型,对于接口或者抽象类来说,此标记的值都为真,其余类型为假 ACC_SYNTHETIC 0x1000 标识这个类并非由用户代码产生的 ACC_ANNOTATION 0x2000 标识这是一个注解 ACC_ENUM 0x4000 标识这是一个枚举 -
外部类拜访标记
标记名称 标记值 形容 ACC_PUBLIC 0x0001 外部类是否为public ACC_PRIVATE 0x0002 外部类是否为private ACC_PROTECTED 0x0004 外部类是否为protected ACC_STATIC 0x0008 外部类是否为protected ACC_FINAL 0x0010 外部类是否为protected ACC_INTERFACE 0x0020 外部类是否为接口 ACC_ABSTRACT 0x0400 外部类是否为abstract ACC_SYNTHETIC 0x1000 外部类是否并非由用户代码产生 ACC_ANNOTATION 0x2000 外部类是否是一个注解 ACC_ENUM 0x4000 外部类是否是一个枚举 -
字段拜访标记
标记名称 标记值 形容 ACC_PUBLIC 0x0001 字段是否为public ACC_PRIVATE 0x0002 字段是否为private ACC_PROTECTED 0x0004 字段是否为protected ACC_STATIC 0x0008 字段是否为static ACC_FINAL 0x0010 字段是否为final ACC_VOLATILE 0x0040 字段是否为volatile ACC_TRANSIENT 0x0080 字段是否为transient ACC_SYNTHETIC 0x1000 字段是否由编译器主动产生的 ACC_ENUM 0x4000 字段是否为enum -
办法拜访标记
标记名称 标记值 形容 ACC_PUBLIC 0x0001 办法是否为public ACC_PRIVATE 0x0002 办法是否为private ACC_PROTECTED 0x0004 办法是否为protected ACC_STATIC 0x0008 办法是否为static ACC_FINAL 0x0010 办法是否为final ACC_SYNCHRONIZED 0x0020 办法是否为synchronized ACC_BRIDGE 0x0040 办法是否由编译器产生的桥接办法 ACC_VARARGS 0x0080 办法是否承受不定参数 ACC_NATIVE 0x0100 办法是否为native ACC_ABSTRACT 0x0400 办法是否为abstract ACC_STRICTFP 0x0800 办法是否为strictfp ACC_SYNTHETIC 0x1000 办法是否由编译器主动产生的
字段表
用于形容接口和类中申明的变量,包含类级别变量以及实例级别变量。
类型 | 名称 | 数量 |
---|---|---|
u2 | access_flags | 1 |
u2 | name_index | 1 |
u2 | descriptor_index | 1 |
u2 | attributes_count | 1 |
u2 | attributes | attributes_count |
其中 access_flags 见下面拜访标记表中的字段拜访标记。
办法表
办法表蕴含拜访标记,名称索引和描述符索引,属性信息等几项。
类型 | 名称 | 数量 |
---|---|---|
u2 | access_flags | 1 |
u2 | name_index | 1 |
u2 | descriptor_index | 1 |
u2 | attributes_count | 1 |
attribute_info | attributes | attributes_count |
其中办法的 access_flags 见上述的办法拜访标记。
属性表
属性表用于解释Class文件中字段表,办法表中携带的属性表汇合,用于形容某些场景专有的信息。
属性名称 | 应用地位 | 含意 |
---|---|---|
Code | 办法表 | Java代码编译成的字节码指令 |
ConstantValue | 字段表 | final关键字定义的常量值 |
Deprecated | 类,办法表,字段表 | final关键字定义的常量值 |
Exceptions | 办法表 | final办法抛出的异样 |
EnclosingMethod | 类文件 | 仅当一个类为部分类或者匿名类时能力领有这个属性,这个属性用于标识这个类所在的外围办法 |
InnerClasses | 类文件 | 外部类列表 |
LineNumberTable | Code属性 | Java源码的行号与字节码指令的对应关系 |
LocalVariableTable | Code属性 | 办法的局部变量形容 |
StackMapTable | Code属性 | JDK1.6中新增的属性,供新的类型查看校验器(Type Checker)检查和解决指标办法的局部变量和操作数栈锁须要的类型是否匹配 |
Signature | 类,办法表,字段表 | JDK1.5中新增的属性,这个属性用于反对泛型状况下的办法签名,在java语言中,任何类,接口,初始化办法或成员的泛型签名如果蕴含了类型变量(Type Variables)或者参数化类型(Parameterized Types),则Signature属性会为它记录泛型签名信息。因为java的泛型采纳擦除法实现,在为了类型信息被擦除后导致签名凌乱,须要这个属性记录泛型中的相干信息 |
SourceFile | 类文件 | 记录源文件名称 |
SourceDebugExtension | 类文件 | JDK1.6中新增的属性,SourceDebugExtension属性用于存储额定的调试信息。譬如在进行JSP文件调试时,无奈通过Java堆栈来定位到JSP文件的行号,JSR-45标准为这些非Java语言编写,却须要编译成字节码并运行在Java虚拟机中的程序提供了一个进行调试的规范机制,应用SourceDebugExtension属性就能够用于存储这个规范所新退出的调试信息 |
Synthetic | 类,办法表,字段表 | 标识办法或者字段是否为编译器主动生成的 |
LocalVariableTypeTable | 类 | JDK1.5中新增的属性,它应用特色签名代替描述符,是为了引入泛型语法之后能形容泛型参数化类型而增加的 |
RuntimevisibleAnnotations | 类,办法表,字段表 | JDK1.5中新增的属性,为动静注解提供反对。RuntimevisibleAnnotations 属性用于指明哪些注解是运行时(实际上运行时就是进行反射调用)可见的 |
RuntimeInvisibleAnnotations | 类,办法表,字段表 | JDK1.5中新增的属性,与 RuntimevisibleAnnotations 属性作用刚好相同, 用于指明哪些注解是运行时不可见的 |
RuntimeVisibleParameterAnnotations | 办法表 | JDK1.5中新增的属性,作用与 RuntimevisibleAnnotations 属性相似,只不过作用对象为办法参数 |
RuntimeInvisibleParameterAnnotations | 办法表 | JDK1.5中新增的属性,作用与 RuntimeInvisibleAnnotations 属性相似,只不过作用对象为办法参数 |
AnnotationDetault | 办法表 | JDK1.5中新增的属性,用于记录注解类元素的默认值 |
BootstrapMethods | 类文件 | JDK1.5中新增的属性,用于保留 invokedynamic 指令援用的疏导办法限定符 |
上述的每一个属性都须要从常量池中援用一个CONSTANT_Utf8_info类型常量来标示。还蕴含attribute_length(u4) 用于标示属性值所占用的位数,前面再跟着属性内容。上面为一些常见的属性子表构造。
- Code属性构造表,用于形容代码块
类型 | 名称 | 数量 |
---|---|---|
u2 | attribute_name_index | 1 |
u4 | attribute_length | 1 |
u2 | max_stack | 1 |
u2 | max_locals | 1 |
u4 | code_length | 1 |
u1 | code | code_lenght |
u2 | exception_table_lenght | 1 |
exception_info | exception_table | exception_table_length |
u2 | attributes_count | 1 |
attribute_info | attributes | attributes_count |
- 异样属性构造表,用于形容异样信息
类型 | 名称 | 数量 |
---|---|---|
u2 | start_pc | 1 |
u2 | end_pc | 1 |
u2 | handler_pc | 1 |
u2 | catch_type | 1 |
- Exceptions属性构造表
区别与异样表,该表次要是列举中办法中可能抛出的受查看异样,也就是办法形容时 throws关键字列举的异样。
类型 | 名称 | 数量 |
---|---|---|
u2 | attribute_name_index | 1 |
u4 | attribute_length | 1 |
u2 | number_of_exceptions | 1 |
u2 | exception_index_table | number_of_exceptions |
- LineNumberTable属性构造表
用于形容 Java 源码行号与字节码行号之间的对应关系,默认宣称到 Class 文件中。
类型 | 名称 | 数量 |
---|---|---|
u2 | attribute_name_index | 1 |
u4 | attribute_length | 1 |
u2 | line_number_table_length | 1 |
line_number_info | line_number_table | line_number_table_length |
其中 line_number_info 蕴含 start_pc 和 line_number 两个 u2 类型的数据项。
- LocalVariableTable属性构造表
用于形容栈帧中局部变量表中的变量与Java源码中定义的变量之间的关系,默认生成到Class文件中。
类型 | 名称 | 数量 |
---|---|---|
u2 | attribute_name_index | 1 |
u4 | attribute_length | 1 |
u2 | local_variable_table_lenght | 1 |
local_variable_info | local_variable_table | local_variable_table_lenght |
其中 local_variable_info 是代表栈帧与源码中局部变量的关联,见下表:
类型 | 名称 | 含意 | 数量 |
---|---|---|---|
u2 | start_pc | 局部变量的生命周期开始的字节码偏移量 | 1 |
u2 | length | 局部变量的生命周期开始的作用范畴笼罩长度 | 1 |
u2 | name_index | 指向常量池 CONSTANT_Utf8_info 索引 | 1 |
u2 | descriptor_index | 指向常量池 CONSTANT_Utf8_info 索引 | 1 |
u2 | index | 局部变量在栈帧局部变量表中Slot的地位 | 1 |
- SourceFile属性构造表
用于记录生成这个 Class文件 的源码文件名称。
类型 | 名称 | 数量 |
---|---|---|
u2 | attribute_name_index | 1 |
u4 | attribute_length | 1 |
u2 | sourcefile_index | 1 |
其中 sourcefile_index 为指向常量池 CONSTANT_Utf8_info 索引。
- ConstantValue属性构造表
用于告诉虚拟机主动为动态变量赋值。只有被 static 关键字润饰的变量才能够应用这项属性。
类型 | 名称 | 数量 |
---|---|---|
u2 | attribute_name_index | 1 |
u4 | attribute_length | 1 |
u2 | constant_index | 1 |
- InnerClasses属性构造表
用于记录外部类与宿主类之间的关联,如果一个类中定义了外部类,编译器则会为它生成外部类 InnerClasses 属性。
类型 | 名称 | 数量 |
---|---|---|
u2 | attribute_name_index | 1 |
u4 | attribute_length | 1 |
u2 | number_of_classes | 1 |
inner_classes_info | inner_classes | number_of_classes |
每一个 inner_classes_info 代表一个外部类信息,构造如下:
类型 | 名称 | 含意 | 数量 |
---|---|---|---|
u2 | inner_class_info_index | 指向常量池 CONSTANT_Class_info 索引 | 1 |
u2 | outer_class_info_index | 指向常量池 CONSTANT_Class_info 索引 | 1 |
u2 | inner_name_index | 指向常量池 CONSTANT_Utf8_info 索引,代表这个外部类的名称,如果匿名则为0 | 1 |
u2 | inner_class_access_flags | 外部类的拜访标记,见上述拜访标记篇章 | 1 |
- Deprecated/Synthetic属性构造表
前者是用于标示某个类,字段或者办法是否不再举荐应用。
后者是用于标示字段或者办法不是由 Java 源码间接产生,所有由非用户代码生成的办法都须要设置 Synthetic属性 或者 ACC_SYNTHETIC标记,然而 init办法 和 clinit办法 除外。构造如下:
类型 | 名称 | 数量 |
---|---|---|
u2 | attribute_name_index | 1 |
u4 | attribute_length | 1 |
- StackMapTable属性构造表
于 JDK1.6 之后增加在 Class 标准中,位于 Code属性 表中,该属性会在虚拟机类加载的字节码校验阶段被新类型查看测验器(Type Checker)应用。
类型 | 名称 | 数量 |
---|---|---|
u2 | attribute_name_index | 1 |
u4 | attribute_length | 1 |
u2 | number_of_entries | 1 |
stack_map_frame | stack_map_frame_entries | number_of_entries |
- Signature属性构造表
于 JDK1.5 公布之后增加到 Class 标准中,它是一个可选的定长属性,能够呈现在类,属性表,办法表构造的属性表中。该属性会记录泛型签名信息,在 Java 语言中泛型采纳的是擦除法实现的伪泛型,在字节码(Code属性)中,泛型信息编译之后都通通被擦除掉。因为无奈像 C# 等运行时反对获取真泛型类型,增加该属性用于补救该缺点,当初 Java 反射曾经能获取到泛型类型。
类型 | 名称 | 数量 |
---|---|---|
u2 | attribute_name_index | 1 |
u4 | attribute_length | 1 |
u2 | signature_index | 1 |
其中 signature_index 值必须是一个对常量池的无效索引且为 CONSTANT_Utf8_info,示意类签名,办法类型签名或字段类型签名。如果以后 Signature 属性是类文件的属性,则这个构造示意类签名,如果以后 Signature 属性是办法表的属性,则示意办法类型签名,如果以后 Signature 属性是字段表的属性,则示意字段类型签名。
- BootstrapMethods属性构造表
于 JDK1.7 公布后增加到 Class 标准中,是一个简单变长的属性,位于类文件的属性表中。
类型 | 名称 | 数量 |
---|---|---|
u2 | attribute_name_index | 1 |
u4 | attribute_length | 1 |
u2 | num_bootstrap_methods | 1 |
bootstrap_method | bootstrap_methods | num_bootstrap_methods |
其中 bootstrap_method 构造如下:
类型 | 名称 | 数量 |
---|---|---|
u2 | bootstrap_method_ref | 1 |
u2 | num_bootstrap_arguments | 1 |
u2 | bootstrap_arguments | num_bootstrap_arguments |
非凡字符串
所谓全限定名,就是应用 “.” 宰割类全名。比方 com/yummylau/TestClass 把类全名的 “.” 换成 “/”,变成 com.yummylau.TestClass,多个全限定名可应用多个 “;”宰割。
而简略名称则没有类型和参数润饰的办法或者字段的名字,比方办法 inc() 和字段 m 别离标示为 inc 和 m 。非凡字符串表蕴含一些根底类型的形容及办法形容。如下:
标识字符 | 含意 |
---|---|
B | 根本类型 byte |
C | 根本类型 char |
D | 根本类型 double |
F | 根本类型 float |
I | 根本类型 int |
J | 根本类型 long |
S | 根本类型 short |
Z | 根本类型 boolean |
V | 根本类型 void |
L | 对象类型,比方 Ljava/lang/Object |
- 针对数组,每一个维度应用一个前置的 [ 字符来形容。比方定义一个 java.lang.String[][] 数组,被记录为 [[java.lang.String,一个整型数组 int[] 被记录为[I
- 针对办法,应用以下描述符:
办法场景 | 描述符 |
---|---|
void inc() | ()V |
java.lang.String toString() | ()Ljava/lang/String; |
int indexOf(char[]source,int sourceOffest,int sourceCount,char[] target,int targetOffset,int targetCOunt,int formIndex) | ([CII[CIII)I |
表格比拟多,然而个别在应用的过程中逐渐查找就能够了。
重新认识字节天书
这份字节天书,我依照上述的class文件构造表字节区间法则从新进行了排版。
行从上到下一一对应class文件构造表中的行。上面开始解析每行字节的含意,根本的逻辑都是索引到某个数据结构,该数据结构对应上述的某一张表格。
第1行为 魔数
,次要是用于确认这个文件是否能被虚拟机加载, CAFEBABE 其实就是 Baristas咖啡。
第2行为 主次版本号
,从 java-class版本对应 可知示意 Java SE 10,向下兼容到 JDK1.1。
第3行为 常量池中常量数量
,因为从 1 开始计数,第 0 项预留用于示意“不援用任何一个常量池我的项目”, 转化 16 进制之后可知常量池有 18 项常量。 每一项常量都对应常量表的某一项, 依照表中规定的每一项常量对应各自的构造。
第4行为 第1项常量
,为类中办法的符号援用,格局为第4项常量.第15项常量,为 java/lang/Object.< init >:()V
第5行为 第2项常量
,为字段的符号援用,格局为第3项常量.第16项常量,为 TestClass.m:I
第6行为 第3项常量
,为类或接口的符号援用,指向第 17 项常量,为 TestClass
第7行为 第4项常量
,为类或接口的符号援用,指向第 18 项常量,为 java/lang/Object
第8行为 第5项常量
,为 UTF-8 编码的字符串,长度为 1, 转化失去 m
第9行为 第6项常量
,为 UTF-8 编码的字符串,长度为 1,转化失去 I
第10行为 第7项常量
,为 UTF-8 编码的字符串,长度为 6,转化失去 < init >
第11行为 第8项常量
,为 UTF-8 编码的字符串,长度为 3,转化失去 ()V
第12行为 第9项常量
,为 UTF-8 编码的字符串,长度为 4,转化失去 Code
第13行为 第10项常量
,为 UTF-8 编码的字符串,长度为 15,转化失去 LineNumberTable
第14行为 第11项常量
,为 UTF-8 编码的字符串,长度为 3,转化失去 inc
第15行为 第12项常量
,为 UTF-8 编码的字符串,长度为 3,转化失去 ()I
第16行为 第13项常量
,为 UTF-8 编码的字符串,长度为 14,转化失去 SourceFile
第17行为 第14项常量
,为 UTF-8 编码的字符串,长度为 10,转化失去 TestClass.java
第18行为 第15项常量
,为字段或办法的局部符号援用, 格局为 {第7项常量}:{第8项常量},为 < init >:()V
第19行为 第16项常量
,为字段或办法的局部符号援用,格局为 {第5项常量}:{第6项常量},为 m:I
第20行为 第17项常量
,为 UTF-8 编码的字符串,长度为9,转化失去 TestClass
第21行为 第18项常量
,为 UTF-8 编码的字符串,长度为16,转化失去 java/lang/Object
第22行为 拜访标记
, 查看拜访标记表 可知为 0x0021(0x0001|0x0020)表明这个是一个一般类,既不是接口,枚举也不是注解,被 public 关键字润饰但没有被申明为 final 或 abstract
第23行为 类索引
,对应 第3项常量
,为 TestClass
第24行为 父类索引
,对应 第4项常量
,为 java/lang/Object
第25行为 实现接口的数目
,0 示意没有实现任何接口
第26行为 字段的数目
,存在一个字段须要解析
第27行 为 第1个字段
,查看字段表可知 拜访标记(0002)为 private, 名字(0005)为 m, 形容(0006)为 I, 没有属性(0000)
第28行 为 办法的数目
,存在两个办法须要解析
第29~32行 为 第1个办法
,查看办法表可知 拜访标记(0001)为 public, 名字(0007)为 < init >, 形容(0008)为 ()V, 一个属性(0001)。因为存在一个属性,持续查看属性表。从 30 行开始解析属性 0009 解析为 第9项常量
Code, 查看属性表-Code属性构造表。然而发现 Code 块内局部字节难以解析。这是因为局部还须要联合 JVM 操作字节码指令才能够。这里先 mark 暂停。
第33~36行 为 第2个办法
,查看办法表可知 拜访标记(0001)为 public, 名字(000B)为 inc, 形容(000C)为 ()I, 一个属性(0001)。也存在一个属性。从 34 行开始解析属性 0009 解析为 第9项常量
Code, 同上,mark 暂停。
第37行为 属性的数目
,存在一个属性
第38行为 第1个属性
,000D解析为 第13项常量
sourceFile, 解析 sourceFile属性失去 TestClass.java
通过上述的解析,咱们可失去:
到此,根本读懂了这份字节天书。 然而 Code 属性内容还是缺失。这时候咱们须要一份字节码指令总表来帮忙咱们进一步解析 Code 外面波及哪些指令及信息。
JVM 操作指令有哪些
上面是 JVM 操作指令表
字节码 | 助记符 | 指令含意 |
---|---|---|
0x00 | nop | 什么都不做 |
0x01 | aconst_null | 将 null 推送至栈顶 |
0x02 | iconst_m1 | 将 int 型 -1 推送至栈顶 |
0x03 | iconst_0 | 将 int 型 0 推送至栈顶 |
0x04 | iconst_1 | 将 int 型 1 推送至栈顶 |
0x05 | iconst_2 | 将 int 型 2 推送至栈顶 |
0x06 | iconst_3 | 将 int 型 3 推送至栈顶 |
0x07 | iconst_4 | 将 int 型 4 推送至栈顶 |
0x08 | iconst_5 | 将 int 型 5 推送至栈顶 |
0x09 | lconst_0 | 将 long 型 0 推送至栈顶 |
0x0a | lconst_1 | 将 long 型 1 推送至栈顶 |
0x0b | fconst_0 | 将 float 型 0 推送至栈顶 |
0x0c | fconst_1 | 将 float 型 1 推送至栈顶 |
0x0d | fconst_2 | 将 float 型 2 推送至栈顶 |
0x0e | dconst_0 | 将 double 型 0 推送至栈顶 |
0x0f | dconst_1 | 将 double 型 1 推送至栈顶 |
0x10 | bipush | 将单字节的常量(-128 – 127)推送至栈顶 |
0x11 | sipush | 将一个短整形常量常量(-32768 – 32767)推送至栈顶 |
0x12 | ldc | 将 int, float, String 型常量值从常量池中推送至栈顶 |
0x13 | ldc_w | 将 int, float, String 型常量值从常量池中推送至栈顶(宽索引) |
0x14 | ldc2_w | 将 long 或 float 型常量值从常量池中推送至栈顶(宽索引) |
0x15 | iload | 将指定的 int 型本地变量推送至栈顶 |
0x16 | lload | 将指定的 long 型本地变量推送至栈顶 |
0x17 | fload | 将指定的 float 型本地变量推送至栈顶 |
0x18 | dload | 将指定的 dload 型本地变量推送至栈顶 |
0x19 | aload | 将指定的援用类型本地变量推送至栈顶 |
0x1a | iload_0 | 将第一个 int 型本地变量推送至栈顶 |
0x1b | iload_1 | 将第二个 int 型本地变量推送至栈顶 |
0x1c | iload_2 | 将第三个 int 型本地变量推送至栈顶 |
0x1d | iload_3 | 将第四个 int 型本地变量推送至栈顶 |
0x1e | lload_0 | 将第一个 long 型本地变量推送至栈顶 |
0x1f | lload_1 | 将第二个 long 型本地变量推送至栈顶 |
0x20 | lload_2 | 将第三个 long 型本地变量推送至栈顶 |
0x21 | lload_3 | 将第四个 long 型本地变量推送至栈顶 |
0x22 | fload_0 | 将第一个 float 型本地变量推送至栈顶 |
0x23 | fload_1 | 将第二个 float 型本地变量推送至栈顶 |
0x24 | fload_2 | 将第三个 float 型本地变量推送至栈顶 |
0x25 | fload_3 | 将第四个 float 型本地变量推送至栈顶 |
0x26 | dload_0 | 将第一个 double 型本地变量推送至栈顶 |
0x27 | dload_1 | 将第二个 double 型本地变量推送至栈顶 |
0x28 | dload_2 | 将第三个 double 型本地变量推送至栈顶 |
0x29 | dload_3 | 将第四个 double 型本地变量推送至栈顶 |
0x2a | aload_0 | 将第一个援用类型本地变量推送至栈顶 |
0x2b | aload_1 | 将第二个援用类型本地变量推送至栈顶 |
0x2c | aload_2 | 将第三个援用类型本地变量推送至栈顶 |
0x2d | aload_3 | 将第四个援用类型本地变量推送至栈顶 |
0x2e | iaload | 将 int 型数组指定索引的值推送至栈顶 |
0x2f | laload | 将 long 型数组指定索引的值推送至栈顶 |
0x30 | faload | 将 float 型数组指定索引的值推送至栈顶 |
0x31 | daload | 将 double 型数组指定索引的值推送至栈顶 |
0x32 | aaload | 将援用型数组指定索引的值推送至栈顶 |
0x33 | baload | 将 boolean 或 byte 型数组指定索引的值推送至栈顶 |
0x34 | caload | 将 char 型数组指定索引的值推送至栈顶 |
0x35 | saload | 将 short 型数组指定索引的值推送至栈顶 |
0x36 | istore | 将栈顶 int 型数值存入指定本地变量 |
0x37 | lstore | 将栈顶 long 型数值存入指定本地变量 |
0x38 | fstore | 将栈顶 float 型数值存入指定本地变量 |
0x39 | dstore | 将栈顶 double 型数值存入指定本地变量 |
0x3a | astore | 将栈顶援用型数值存入指定本地变量 |
0x3b | istore_0 | 将栈顶 int 型数值存入第一个本地变量 |
0x3c | istore_1 | 将栈顶 int 型数值存入第二个本地变量 |
0x3d | istore_2 | 将栈顶 int 型数值存入第三个本地变量 |
0x3e | istore_3 | 将栈顶 int 型数值存入第四个本地变量 |
0x3f | lstore_0 | 将栈顶 long 型数值存入第一个本地变量 |
0x40 | lstore_1 | 将栈顶 long 型数值存入第二个本地变量 |
0x41 | lstore_2 | 将栈顶 long 型数值存入第三个本地变量 |
0x42 | lstore_3 | 将栈顶 long 型数值存入第四个本地变量 |
0x43 | fstore_0 | 将栈顶 float 型数值存入第一个本地变量 |
0x44 | fstore_1 | 将栈顶 float 型数值存入第二个本地变量 |
0x45 | fstore_2 | 将栈顶 float 型数值存入第三个本地变量 |
0x46 | fstore_3 | 将栈顶 float 型数值存入第四个本地变量 |
0x47 | dstore_0 | 将栈顶 double 型数值存入第一个本地变量 |
0x48 | dstore_1 | 将栈顶 double 型数值存入第二个本地变量 |
0x49 | dstore_2 | 将栈顶 double 型数值存入第三个本地变量 |
0x4a | dstore_3 | 将栈顶 double 型数值存入第四个本地变量 |
0x4b | astore_0 | 将栈顶援用型数值存入第一个本地变量 |
0x4c | astore_1 | 将栈顶援用型数值存入第二个本地变量 |
0x4d | astore_2 | 将栈顶援用型数值存入第三个本地变量 |
0x4e | astore_3 | 将栈顶援用型数值存入第四个本地变量 |
0x4f | iastore | 将栈顶 int 型数值存入指定数组的指定索引地位 |
0x50 | lastore | 将栈顶 long 型数值存入指定数组的指定索引地位 |
0x51 | fastore | 将栈顶 float 型数值存入指定数组的指定索引地位 |
0x52 | dastore | 将栈顶 double 型数值存入指定数组的指定索引地位 |
0x53 | aastore | 将栈顶援用型数值存入指定数组的指定索引地位 |
0x54 | bastore | 将栈顶 boolean 或 byte 型数值存入指定数组的指定索引地位 |
0x55 | castore | 将栈顶 char 型数值存入指定数组的指定索引地位 |
0x56 | sastore | 将栈顶 short 型数值存入指定数组的指定索引地位 |
0x57 | pop | 将栈顶数值弹出(数值不能是 long 或 double 类型) |
0x58 | pop_2 | 将栈顶的一个(对于 long 或 double 类型)或两个数值(对于非 long 或 double 的其余类型)弹出 |
0x59 | dup | 复制栈顶数值并将复制值压入栈顶 |
0x5a | dup_x1 | 复制栈顶数值并将两个复制值压入栈顶 |
0x5b | dup_x2 | 复制栈顶数值并将三个(或两个)复制值压入栈顶 |
0x5c | dup_2 | 复制栈顶一个(对于 long 或 double 类型)或两个(非 long 或 double 的其余类型)数值并将复制值压入栈顶 ) |
0x5d | dup_2_x1 | dup_x1 指令的双倍版本 |
0x5e | dup_2_x2 | dup_x2 指令的双倍版本 |
0x5f | swap | 将栈最顶端的两个数值调换(数值不能是 long 或 double 类型) |
0x60 | iadd | 将栈顶两 int 型数值相加并将后果压入栈顶 |
0x61 | ladd | 将栈顶两 long 型数值相加并将后果压入栈顶 |
0x62 | fadd | 将栈顶两 float 型数值相加并将后果压入栈顶 |
0x63 | dadd | 将栈顶两 double 型数值相加并将后果压入栈顶 |
0x64 | isub | 将栈顶两 int 型数值相减并将后果压入栈顶 |
0x65 | lsub | 将栈顶两 long 型数值相减并将后果压入栈顶 |
0x66 | fsub | 将栈顶两 float 型数值相减并将后果压入栈顶 |
0x67 | dsub | 将栈顶两 double 型数值相减并将后果压入栈顶 |
0x68 | imul | 将栈顶两 int 型数值相乘并将后果压入栈顶 |
0x69 | lmul | 将栈顶两 long 型数值相乘并将后果压入栈顶 |
0x6a | fmul | 将栈顶两 float 型数值相乘并将后果压入栈顶 |
0x6b | dmul | 将栈顶两 double 型数值相乘并将后果压入栈顶 |
0x6c | idiv | 将栈顶两 int 型数值相除并将后果压入栈顶 |
0x6d | ldiv | 将栈顶两 long 型数值相除并将后果压入栈顶 |
0x6e | fdiv | 将栈顶两 float 型数值相除并将后果压入栈顶 |
0x6f | ddiv | 将栈顶两 double 型数值相除并将后果压入栈顶 |
0x70 | irem | 将栈顶两 int 型数值作取模运算并将后果压入栈顶 |
0x71 | lrem | 将栈顶两 long 型数值作取模运算并将后果压入栈顶 |
0x72 | frem | 将栈顶两 float 型数值作取模运算并将后果压入栈顶 |
0x73 | drem | 将栈顶两 double 型数值作取模运算并将后果压入栈顶 |
0x74 | ineg | 将栈顶两 int 型数值作负并将后果压入栈顶 |
0x75 | lneg | 将栈顶两 long 型数值作负并将后果压入栈顶 |
0x76 | fneg | 将栈顶两 float 型数值作负并将后果压入栈顶 |
0x77 | dneg | 将栈顶两 double 型数值作负并将后果压入栈顶 |
0x78 | ishl | 将栈顶两 int 型数值左移位指定位数并将后果压入栈顶 |
0x79 | lshl | 将栈顶两 long 型数值左移位指定位数并将后果压入栈顶 |
0x7a | ishr | 将栈顶两 int 型数值右(带符号)移位指定位数并将后果压入栈顶 |
0x7b | lshr | 将栈顶两 long 型数值右(带符号)移位指定位数并将后果压入栈顶 |
0x7c | iushr | 将栈顶两 int 型数值右(无符号)移位指定位数并将后果压入栈顶 |
0x7d | lushr | 将栈顶两 long 型数值右(无符号)移位指定位数并将后果压入栈顶 |
0x7e | iand | 将栈顶两 int 型数值作 “按位与” 并将后果压入栈顶 |
0x7f | land | 将栈顶两 long 型数值作 “按位与” 并将后果压入栈顶 |
0x80 | ior | 将栈顶两 int 型数值作 “按位或” 并将后果压入栈顶 |
0x81 | lor | 将栈顶两 long 型数值作 “按位或” 并将后果压入栈顶 |
0x82 | ixor | 将栈顶两 int 型数值作 “按位异或” 并将后果压入栈顶 |
0x83 | lxor | 将栈顶两 long 型数值作 “按位异或” 并将后果压入栈顶 |
0x84 | iinc | 间接对 int 型变量减少指定值(如i++, i–, i+=2等) |
0x85 | i2l | 将栈顶 int 型数值强制转成 long 型数值并将后果压入栈顶 |
0x86 | i2f | 将栈顶 int 型数值强制转成 float 型数值并将后果压入栈顶 |
0x87 | i2d | 将栈顶 int 型数值强制转成 double 型数值并将后果压入栈顶 |
0x88 | l2i | 将栈顶 long 型数值强制转成 int 型数值并将后果压入栈顶 |
0x89 | l2f | 将栈顶 long 型数值强制转成 float 型数值并将后果压入栈顶 |
0x8a | l2d | 将栈顶 long 型数值强制转成 double 型数值并将后果压入栈顶 |
0x8b | f2i | 将栈顶 float 型数值强制转成 int 型数值并将后果压入栈顶 |
0x8c | f2l | 将栈顶 float 型数值强制转成 long 型数值并将后果压入栈顶 |
0x8d | f2d | 将栈顶 float 型数值强制转成 double 型数值并将后果压入栈顶 |
0x8e | d2i | 将栈顶 double 型数值强制转成 int 型数值并将后果压入栈顶 |
0x8f | d2l | 将栈顶 double 型数值强制转成 long 型数值并将后果压入栈顶 |
0x90 | d2f | 将栈顶 double 型数值强制转成 float 型数值并将后果压入栈顶 |
0x91 | i2b | 将栈顶 int 型数值强制转成 byte 型数值并将后果压入栈顶 |
0x92 | i2c | 将栈顶 int 型数值强制转成 char 型数值并将后果压入栈顶 |
0x93 | i2s | 将栈顶 int 型数值强制转成 short 型数值并将后果压入栈顶 |
0x94 | lcmp | 比拟栈顶两 long 型数值的大小,并将后果(1, 0 或 -1)压入栈顶 |
0x95 | fcmpl | 比拟栈顶两 float 型数值的大小,并将后果(1, 0 或 -1)压入栈顶; 当其中一个数值为 “NaN” 时,将 -1 压入栈顶 |
0x96 | fcmpg | 比拟栈顶两 float 型数值的大小,并将后果(1, 0 或 -1)压入栈顶; 当其中一个数值为 “NaN” 时,将 1 压入栈顶 |
0x97 | dcmpl | 比拟栈顶两 double 型数值的大小,并将后果(1, 0 或 -1)压入栈顶; 当其中一个数值为 “NaN” 时,将 -1 压入栈顶 |
0x98 | dcmpg | 比拟栈顶两 double 型数值的大小,并将后果(1, 0 或 -1)压入栈顶; 当其中一个数值为 “NaN” 时,将 1 压入栈顶 |
0x99 | ifeg | 当栈顶 int 型数值等于 0 时跳转 |
0x9a | ifne | 当栈顶 int 型数值不等于 0 时跳转 |
0x9b | iflt | 当栈顶 int 型数值小于 0 时跳转 |
0x9c | ifge | 当栈顶 int 型数值大于或等于 0 时跳转 |
0x9d | ifgt | 当栈顶 int 型数值大于 0 时跳转 |
0x9e | ifle | 当栈顶 int 型数值小于或等于 0 时跳转 |
0x9f | if_icmpeq | 比拟栈顶两 int 型数值的大小,当后果等于 0 时跳转 |
0xa0 | if_icmpne | 比拟栈顶两 int 型数值的大小,当后果不等于 0 时跳转 |
0xa1 | if_icmplt | 比拟栈顶两 int 型数值的大小,当后果小于 0 时跳转 |
0xa2 | if_icmpge | 比拟栈顶两 int 型数值的大小,当后果大于或等于 0 时跳转 |
0xa3 | if_icmpgt | 比拟栈顶两 int 型数值的大小,当后果大于 0 时跳转 |
0xa4 | if_icmple | 比拟栈顶两 int 型数值的大小,当后果小于或等于 0 时跳转 |
0xa5 | if_icmpeq | 比拟栈顶两援用型数值,当后果相等时跳转 |
0xa6 | if_icmpnc | 比拟栈顶两援用型数值,当后果不相等时跳转 |
0xa7 | goto | 无条件跳转 |
0xa8 | jsr | 跳转至指定的 16 位 offset 地位,并将 jsr 的下一条指令地址压入栈顶 |
0xa9 | ret | 返回至本地变量指定的 index 的指令地位(个别与 jsr 或 jsr_w 联结应用) |
0xaa | tableswitch | 用于 switch 条件跳转, case 值间断(可变长度指令) |
0xab | lookupswitch | 用于 switch 条件跳转, case 值连不续(可变长度指令) |
0xac | ireturn | 从以后办法返回 int |
0xad | lreturn | 从以后办法返回 long |
0xae | freturn | 从以后办法返回 float |
0xaf | dreturn | 从以后办法返回 double |
0xb0 | areturn | 从以后办法返回对象援用 |
0xb1 | return | 从以后办法返回 void |
0xb2 | getstatic | 获取指定类的动态域,并将其值压入栈顶 |
0xb3 | putstatic | 为指定的类的动态域赋值 |
0xb4 | getfield | 获取指定类的实例域,并将其值压入栈顶 |
0xb5 | putfield | 为指定的类的实例域赋值 |
0xb6 | invokevirtual | 调用实例办法 |
0xb7 | invokespecial | 调用超类构造方法, 实例初始化办法,公有办法 |
0xb8 | invokestatic | 调用静态方法 |
0xb9 | invokeinterface | 调用接口办法 |
0xba | invokedynamic | 调用动静办法 |
0xbb | new | 创立一个对象,并将其援用值压入栈顶 |
0xbc | newarray | 创立一个指定的原始类型(如 int, float等)的数组,并将其援用值压入栈顶 |
0xbd | anewarray | 创立一个援用型(如 类,接口,数组)的数组,并将其援用值压入栈顶 |
0xbe | arraylength | 取得数组的长度值并压入栈顶 |
0xbf | athrow | 将栈顶的异样抛出 |
0xc0 | checkcast | 测验类型转换, 测验未通过将抛出 ClassCastException |
0xc1 | instanceof | 测验对象是否时指定类的实例, 如果是, 则将 1 压入栈顶,否则将 0 压入栈顶 |
0xc2 | monitorenter | 取得对象的锁,用于同步办法或同步块 |
0xc3 | monitorexit | 开释对象的锁,用于同步办法或同步块 |
0xc4 | wide | 扩大本地变量的宽度 |
0xc5 | multianewarray | 创立指定类型和指定维度的多维数组(执行该指令时,操作栈中必须蕴含各维度的长度值),并将其援用值压入栈顶 |
0xc6 | ifnull | 为 null 时跳转 |
0xc7 | ifnonnull | 不为 null 时跳转 |
0xc8 | goto_w | 无条件跳转(宽索引) |
0xc9 | jsr_w | 跳转至指定的 32 位 offset 地位,并将 jsr_w 的下一条指令地址压入栈顶 |
上述表格内容更为具体的信息可参考 官网JVM指令文档,除上述表外,还须要意识一些数据类型及转化对应规定,同时再对上述指令的应用场景做一些总结划分。
数据类型在指令中的转化
数据类型 | byte | short | int | long | float | double | char | reference |
---|---|---|---|---|---|---|---|---|
简化转化 | b | s | i | l | f | d | c | a |
指令集反对的数据类型
上面表格中T+指令形成 opcode, T 为下面表格各数据类型的简化转化。
opcode | byte | short | int | long | float | double | char | reference | |
---|---|---|---|---|---|---|---|---|---|
Tipush | bipush | sipush | |||||||
Tconst | iconst | lconst | fconst | dconst | aconst | ||||
Tload | iload | lload | fload | dload | aload | ||||
Tstore | istore | lstore | fstore | dstore | astore | ||||
Tinc | iinc | ||||||||
Taload | baload | saload | iaload | laload | faload | daload | caload | aaload | |
Tastore | bastore | sastore | iastore | lastore | fastore | dastore | castore | aastore | |
Tadd | iadd | ladd | fadd | dadd | |||||
Tsub | isub | lsub | fsub | dsub | |||||
Tmul | imul | lmul | fmul | dmul | |||||
Tdiv | idiv | ldiv | fdiv | ddiv | |||||
Trem | irem | lrem | frem | drem | |||||
Tneg | ineg | lneg | fneg | dneg | |||||
Tshl | ishl | lshl | |||||||
Tshr | ishr | lshr | |||||||
Tushr | iushr | lushr | |||||||
Tand | iand | land | |||||||
Tor | ior | lor | |||||||
Txor | ixor | lxor | |||||||
i2T | i2b | i2s | i2l | i2f | i2d | ||||
l2T | l2i | l2f | l2d | ||||||
f2T | f2i | f2l | f2d | ||||||
d2T | d2i | d2l | d2f | ||||||
Tcmp | lcmp | ||||||||
Tcml | fcml | dcml | |||||||
Tcmpg | fcmpg | dcmpg | |||||||
if_TcmpOP | if_icmpOP | if_acopOP | |||||||
Treturn | ireturn | lreturn | freturn | dreturn | areturn |
大部分指令没有反对 byte,char 和 short 甚至是 boolean,编译器会在编译期或运行期把这类数据扩大为 int 类型数据。
加载/存储指令
加载/存储指令用于将数据在栈帧中的局部变量表和操作数栈之间来回传输。
- 将一个局部变量加载到操作栈:Tload,Tload_n。后者示意是一组指令。
- 将一个数值从操作数栈存储到局部变量表:Tstore ,Tstore_n。后者示意是一组指令。
- 将一个常量加载到操作数栈:Tipush,ldc,T_const 等
- 裁减局部变量表的拜访索引指令:wide
运算指令
对操作数栈的数值进行运算之后把后果从新存入操作栈栈顶。
- 加法指令Tadd
- 减法指令Tsub
- 乘法指令Tmul
- 除法指令Tdiv
- 求余指令Trem
- 取反指令Tneg
- 位移指令Tshl,Tshr,Tushr
- 按位或指令Tor
- 按位与指令Tand
- 按位异或指令Txor
- 局部变量自增指令Tinc
- 比拟指令Tcmpg ,Tcmpl
类型转化指令
类型转化指令用于将两种不同的数值类型进行互相转换,这种转换操作个别用于实现用户代码中的显式转换操作,或者用于解决字节码指令集中数据类型相干指令无奈与数据类型一一对应的问题。
- int类型转其余i2T
- long类型转其余l2T
- float类型转其余f2T
- double类型转其余d2T
对象创立与拜访指令
只管类实例和数组都是对象,但 Java虚拟机 对类实例和数组的创立与操作应用了不同的字节码指令。
- 创立类实例new
- 创立数组newarray,anewarray,multianewarray
- 拜访类变量和实例变量getfield,putfield,getstatic,putstatic
- 把一个数组元素加载到操作数栈Taload
- 将一个操作数栈的值存储到数组元素中Tastore
- 取数组长度的指令arraylength
- 查看类实例类型instanceof, checkcast
操作数栈治理指令
- 将操作数栈栈顶一个或者两个元素出栈pop,pop2
- 复制栈顶一个或两个数值并将复制值从新压入栈顶dup,dup2,dup_x1,dup2_x1,dup_x2,dup2_x2
- 将栈最顶端两个数值调换swap
管制转移指令
让虚拟机能够有条件或者无条件地从特定地位指令执行程序而不是在管制转移指令的下一条指令执行程序。
- 条件分支ifeq,ifit,ifle,ifne,ifgt,ifge,ifull,ifnonnull,if_icmpeq,if_icmpne,if_icmplt,if_icmpgt,if_icmple,if_icmpge,if_acmpeq,if_acmpne
- 复合条件分支tableswitch,lookupswitch`
- 无条件分支goto,goto_w,jsr,jsr_w,ret
办法调用和返回指令
- 调用对象的实例办法invokevirtual,依据对象的理论类型进行分派
- 调用接口办法invokeinterface, 会在运行时搜寻一个实现了这个接口的办法的对象,找到适宜的办法进行调用
- 调用一些须要非凡解决的实例办法invokespecial,包含实例初始化办法,公有办法和父类办法
- 调用类办法invokestatic 用于调用 static 办法
- 运行时动静解析处调用点限定符所援用的办法并执行该办法invokedynamic,区别于后面4条指令,它们都在固化在 JVM 外部,而该指令的分派逻辑是由用户所设定的疏导办法决定的。
异样解决指令
athrow指令用于实现显式抛出异样(throw语句)的操作,除了用throw语句之外,JVM 还规定在运行时会在其余 JVM 指令检测到异样情况的时候主动抛出。比方当除数为 0 时 JVM 会在idiv或ldiv中抛出ArithmeticException异样。
同步指令
JVM的同步有一下场景,都是应用管程(Monitor)来反对
- 办法级的同步,不须要字节码管制,实现于办法调用和返回操作志宏。从办法表中ACC_SYNCHRONIZED失去一个办法是否是同步,如果被设置,则执行线程须要先持有管程能力执行,执行完之后开释管程。
- 办法外部一段指令序列的同步,由指令 monitorenter 和 monitorexit 来反对 synchronized 实现。
咱们的 ???? 非常简单,实际上用不到这么多指令的,其余的可备份用于查问。
指令集辅助解析 Code
有了上述指令集帮忙及膝,回到天书中的第 29-36 行内容从新解析。
第29-32行为 第1个办法
, 查看办法表可知 拜访标记(0001)为 public, 名字(0007)为 < init >, 形容(0008)为 ()V, 一个属性(0001)。因为存在一个属性,持续查看属性。从 30 行开始解析属性 0009 解析为 第9项常量
Code, 查看属性表-Code属性构造表及联合指令集中操作符信息, Code 属性最终的内容如下。(看到这里,你应该尝试过一遍哦 ????)
第33-36行为 第2个办法
, 查看办法表可知 拜访标记(0001)为 public, 名字(000B)为 inc, 形容(000C)为 ()I, 一个属性(0001)。也存在一个属性。从 34 行开始解析属性 0009 解析为 第9项常量
Code, 内容如下。
至此,class文件内容根本确定可知。
为了验证咱们的思路是否正确,能够通过javap查看 TestClass.class 的构造来进行比照。
除了javap帮咱们做了格式化的工作外,也是依照咱们剖析字节码的逻辑来进行内容的输入, 感兴趣的搭档能够查看javap外部实现。
当你读懂Class文件之后,你就能够进一步做很多工作了,比方借助 ASM 框架入侵 Gradle 构建流程注入动态代码等,更多场景等你开掘。
如果文章对您有帮忙,欢送点赞评论在看反对~
专一 Android 进阶技术分享,记录架构师横蛮成长之路
如果在Android畛域有遇到任何问题,包含我的项目遇到的技术问题,面试及简历形容问题,亦或对将来职业规划有纳闷,可增加我微信 「Ming_Lyan」 或关注公众号 「Android之禅」,会尽自所能和你探讨解决。
后续会针对 “Android 畛域的必备进阶技术”,“Android高可用架构设计及实际” ,“业务中的疑难杂症及解决方案” 等实用内容进行分享。
也会分享作为技术者如何在公司横蛮成长,包含技术提高,职级及支出的晋升。
欢送来撩。