新用户注册入口 老用户登录入口

[转载]详解Class类文件的结构(上)

文章作者:转载 更新时间:2024-01-09 17:46:36 阅读数量:644
文章标签:Class文件字节码结构符号引用字面量
本文摘要:这篇文章剖析了Java Class文件(字节码文件)的核心结构,从魔数、文件版本号到关键的常量池,深入解读其内部构成。Class文件在Java虚拟机(JVM)上运行,与具体编程语言无关,其内容包括无符号数和表两种数据类型,并以紧凑格式存储。其中,魔数用于验证文件的有效性,文件版本确保与JVM版本兼容。常量池作为重要部分,包含了字面量与符号引用,是类加载过程解析阶段的关键所在。此外,访问标志字段则标识了类或接口的访问信息等属性。通过解析常量池,可洞察Java程序在编译后的二进制表示方式及其在运行时如何被JVM处理。
转载文章

本篇文章为转载内容。原文链接:https://javar.blog.csdn.net/article/details/97532925。

该文由互联网用户投稿提供,文中观点代表作者本人意见,并不代表本站的立场。

作为信息平台,本站仅提供文章转载服务,并不拥有其所有权,也不对文章内容的真实性、准确性和合法性承担责任。

如发现本文存在侵权、违法、违规或事实不符的情况,请及时联系我们,我们将第一时间进行核实并删除相应内容。

前言

相信搞Java开发的同学都经常会接触到Class类文件,了解了JVM虚拟机之后也会大量接触到class字节码,那么它到底是什么样的文件?内部由什么构成?虚拟机又是如何去识别它的?这篇文章就来学习一下Class类文件的结构

ps:我在面试蚂蚁的时候被问到过这个问题!你没看错,面试也有可能会问。

一、什么是Class文件

Class文件又称字节码文件,一种二进制文件,它是由某种语言经过编译而来,注意这里并不一定是Java语言,还有可能是Clojure、Groovy、JRuby、Jython、Scala等,Class文件运行在Java虚拟机上。Java虚拟机不与任何一种语言绑定,它只与Class文件这种特定的二进制文件格式所关联。

虚拟机具有语言无关性,它不关心Class文件的来源是何种语言,它只关心Class文件中的内容。Java语言中的各种变量、关键字和运算符号的语义最终都是由多条字节码命名组合而成的,因此字节码命令所能提供的语义描述能力比Java语言本身更加强大。

二、Class文件的结构

虚拟机可以接受任何语言编译而成的Class文件,因此也给虚拟机带来了安全隐患,为了提供语言无关性的功能就必须做好安全防备措施,避免危险有害的类文件载入到虚拟机中,对虚拟机造成损害。所以在类加载的第二大阶段就是验证,这一步工作是虚拟机安全防护的关键所在,其中检查的步骤就是对class文件按照《Java虚拟机规范》规定的内容来对其进行验证。

1.总体结构

Class文件是一组以8位字节为基础单位的二进制流,各个数据项目严格按照顺序紧凑地排列在Class文件之中,中间没有添加任何分隔符,Class文件中存储的内容几乎全部是程序运行的必要数据,没有空隙存在。当遇到需要占用8位字节以上空间的数据项时,就按照高位在前的方式分割成若干个8位字节进行存储。

Class文件格式采用类似于C语言结构体的伪结构来存储数据,这种伪结构只有两种数据类型:无符号数和表。

  • 无符号数属于基本的数据类型,以u1、u2、u4、u8来分别代表1个字节、2个字节、4个字节、8个字节的无符号数,无符号数可以来描述数字、索引引用、数量值或者按照UTF-8编码构成字符串值。
  • 表是由多个无符号数或者其他表作为数据项构成的复合数据类型,所有表都习惯性的以“_info”结尾。表用于描述有层次关系的复合结构的数据,整个Class文件本质上就是一张表,它的数据项构成如下图。

2.魔数(Magic Number)

每一个Class文件的头4个字节成为魔数(Magic Number),它的唯一作用是确定这个文件是否是一个能被虚拟机接收的Class文件。很多文件存储标准中都是用魔数来进行身份识别,比如gif、png、jpeg等都有魔数。使用魔数主要是来识别文件的格式,相比于通过文件后缀名识别,这种方式准确性更高,因为文件后缀名可以随便更改,但更改二进制文件内容的却很少。Class类文件的魔数是Oxcafebabe,cafe babe?咖啡宝贝?至于为什么是这个, 这个名字在java语言诞生之初就已经确定了,它象征着著名咖啡品牌Peet's Coffee中深受欢迎的Baristas咖啡,Java的商标logo也源于此。

3.文件版本(Version)

在魔数后面的4个字节就是Class文件的版本号,第5和第6个字节是次版本号(Minor Version),第7和第8个字节是主版本号(Major Version)。Java的版本号是从45开始的,JDK1.1之后的每个JDK大版本发布主版本号向上加1(JDK1.0~1.1使用的版本号是45.0~45.3),比如我这里是十六进制的Ox0034,也就是十进制的52,所以说明该class文件可以被JDK1.8及以上的虚拟机执行,否则低版本虚拟机执行会报java.lang.UnsupportedClassVersionError错误。

4.常量池(Constant Pool)

在主版本号紧接着的就是常量池的入口,它是Class文件结构中与其他项目关联最多的数据类型,也是占用空间最大的数据之一。常量池的容量由后2个字节指定,比如这里我的是Ox001d,即十进制的29,这就表示常量池中有29项常量,而常量池的索引是从1开始的,这一点需要特殊记忆,因为程序员习惯性的计数法是从0开始的,而这里不一样,所以我这里常量池的索引范围是1~29。设计者将第0项常量空出来是有目的的,这样可以满足后面某些指向常量池的索引值的数据在特定情况下需要表达“不引用任何一个常量池项目”的含义。

通过javap -v命令反编译出class文件之后,我们可以看到常量池的内容

常量池中主要存放两大类常量:字面量符号引用。比如文本字符、声明为final的常量值就属于字面量,而符号引用则包含下面三类常量:

  • 类和接口的全限名
  • 字段的名称和描述符
  • 方法的名称和描述符

在之前的文章(详谈类加载的全过程)中有详细讲到,在加载类过程的第二大阶段连接的第三个阶段解析的时候,会将常量池中的符号引用替换为直接引用。相信很多人在开始了解那里的时候也是一头雾水,作者我也是,当我了解到常量池的构成的时候才明白真正意思。Java代码在编译的时候,是在虚拟机加载Class文件的时候才会动态链接,也就是说Class文件中不会保存各个方法、字段的最终内存布局信息,因此这些字段、方法的符号引用不经过运行期转换的话无法获得真正的内存入口地址,也就无法直接被虚拟机使用。当虚拟机运行时,需要从常量池获得对应的符号引用,再在类创建时或运行时解析、翻译到具体的内存地址之中

常量池中每一项常量都是一张表,这里我只找到了JDK1.7之前的常量池项目类型表,见下图。

  • 常量池项目类型表:

  • 常量池常量项的结构总表:

比如我这里测试的class文件第一项常量,它的标志位是Ox0a,即十进制10,即表示tag为10的常量项,查表发现是CONSTANT_Methodref_info类型,和上面反编译之后的到的第一个常量是一致的,Methodref表示类中方法的符号引用。查上面《常量池常量项的结构总表》可以看到Methodref中含有3个项目,第一个tag就是上述的Ox0a,那么第二个项目就是Ox0006,第三个项目就是Ox000f,分别指向的CONSTANT_Class_info索引项和CONSTANT_NameAndType_info索引项为6和15,那么反编译的结果该项常量指向的应该是#6和#15,查看上面反编译的图应证我们的推测是对的。后面的常量项就以此类推。

这里需要特殊说明一下utf8常量项的内容,这里我以第29项常量项解释,也就是最后一项常量项。查《常量池常量项的结构总表》可以看到utf8项有三个内容:tag、length、bytes。tag表示常量项类型,这里是Ox01,表示是CONSTANT_Utf8_info类型,紧接着的是长度length,这里是Ox0015,即十进制21,那么再紧接着的21个字节都表示该项常量项的具体内容。特别注意length表示的最大值是65535,所以Java程序中仅能接收小于等于64KB英文字符的变量和变量名,否则将无法编译

5.访问标志(Access Flags)

在常量池结束后,紧接着的两个字节代表访问标志(Access Flags),该标志用于识别一些类或者接口层次的访问信息,其中包括:Class是类还是接口、是否定义为public、是否定义为abstract类型、类是否被声明为final等。

访问标志表

标志位一共有16个,但是并不是所有的都用到,上表只列举了其中8个,没有使用的标志位统统置为0,access_flags只有2个字节表示,但是有这么多标志位怎么计算而来的呢?它是由标志位为true的标志位值取或运算而来,比如这里我演示的class文件是一个类并且是public的,所以对应的ACC_PUBLIC和ACC_SIPER标志应该置为true,其余标志不满足则为false,那么access_flags的计算过程就是:Ox0001 | Ox0020 = Ox0021

篇幅原因,未完待续......

参考文献:《深入理解Java虚拟机》

END

本篇文章为转载内容。原文链接:https://javar.blog.csdn.net/article/details/97532925。

该文由互联网用户投稿提供,文中观点代表作者本人意见,并不代表本站的立场。

作为信息平台,本站仅提供文章转载服务,并不拥有其所有权,也不对文章内容的真实性、准确性和合法性承担责任。

如发现本文存在侵权、违法、违规或事实不符的情况,请及时联系我们,我们将第一时间进行核实并删除相应内容。

相关阅读
文章标题:[转载][洛谷P1082]同余方程

更新时间:2023-02-18
[转载][洛谷P1082]同余方程
文章标题:[转载]webpack优化之HappyPack实战

更新时间:2023-08-07
[转载]webpack优化之HappyPack实战
文章标题:[转载]oracle 同时更新多表,在Oracle数据库中同时更新两张表的简单方法

更新时间:2023-09-10
[转载]oracle 同时更新多表,在Oracle数据库中同时更新两张表的简单方法
文章标题:[转载][Unity] 包括场景互动与射击要素的俯视角闯关游戏Demo

更新时间:2024-03-11
[转载][Unity] 包括场景互动与射击要素的俯视角闯关游戏Demo
文章标题:[转载]程序员也分三六九等?等级差异,一个看不起一个!

更新时间:2024-05-10
[转载]程序员也分三六九等?等级差异,一个看不起一个!
文章标题:[转载]海贼王 动漫 全集目录 分章节 精彩打斗剧集

更新时间:2024-01-12
[转载]海贼王 动漫 全集目录 分章节 精彩打斗剧集
名词解释
作为当前文章的名词解释,仅对当前文章有效。
Class文件Class文件是Java程序编译后生成的二进制文件格式,也称为字节码文件。它包含了Java类或接口的所有结构信息,包括常量池、访问标志、字段描述、方法描述等数据项。这些信息按照特定的格式存储在Class文件中,并且被设计为与具体编程语言无关,由Java虚拟机(JVM)直接读取和执行。
字节码字节码是一种中间表示形式,它是源代码经过编译器编译后的产物,但并非机器码。在Java中,源代码会被编译成Class文件中的字节码指令集,这种指令集可以被不同平台上的Java虚拟机识别并执行,实现了“一次编写,到处运行”的特性。字节码的主要作用是作为独立于具体CPU架构的可执行指令集,能够在各种支持Java的平台上运行。
常量池(Constant Pool)常量池是Class文件中的一个重要组成部分,它是Class文件结构中占用空间较大的数据区域之一。常量池中主要存放两大类常量。
延伸阅读
作为当前文章的延伸阅读,仅对当前文章有效。
在深入理解Java Class文件结构及其在JVM中的运作机制后,我们可以进一步关注与之相关的前沿技术和实践应用。近期,随着JDK 17的发布,对Class文件格式的支持和优化有了新的进展。例如,JEP 391(密封类)引入了新的类声明语法,允许限制哪些其他类或模块可以继承或实现一个密封类或接口,这种特性在编译阶段会生成更为精确的符号引用,有助于增强类型安全性和提升性能。
同时,随着JIT即时编译器的发展,如GraalVM项目,其先进的动态编译技术能更高效地将字节码转换为机器码,使得Java应用程序执行效率大幅提升。对于Class文件内部结构的理解,有助于我们更好地利用这些新特性和工具进行优化配置。
此外,随着微服务、容器化和云原生架构的普及,Class文件在服务启动速度和资源占用上的优化也显得尤为重要。例如,通过提前解析和验证Class文件以减少运行时开销,或者采用Ahead-of-Time(AOT)编译技术将部分Class文件直接编译成本地代码,从而提升系统启动速度和降低内存使用。
另外,对于安全领域,深入理解Class文件结构有助于分析恶意字节码攻击手段,以及如何通过虚拟机层面的安全防护措施来避免有害类文件的加载执行。例如,最新的Java版本不断强化类加载验证机制,防止非法或恶意篡改的Class文件危害系统安全。
综上所述,随着Java技术栈的持续演进,Class文件这一基础而又关键的概念,在实际开发和运维过程中仍具有极高的研究价值和实战意义,值得开发者们密切关注和深入探索。
知识学习
实践的时候请根据实际情况谨慎操作。
随机学习一条linux命令:
nc host port - 通过netcat工具连接到远程主机和端口。
随便看看
拉到页底了吧,随便看看还有哪些文章你可能感兴趣。
Kylin配置与部署:Hadoop、HBase、Java环境搭建与优化 12-31 jQuery基于窗口的照片查看器插件 09-27 5种炫酷js鼠标跟随动画特效插件 03-12 紫色宽屏瑜伽课程培训网站模板 01-04 红色响应式女性美容美甲企业html网站模板 12-19 可自定义颜色的jQuery颜色拾取器插件 12-08 [转载]开放式激光振镜+运动控制器(六):双振镜运动 12-04 宽屏创意思维案例展示源码模板下载 11-12 css样式选择器优先级 11-06 本次刷新还10个文章未展示,点击 更多查看。
揭秘Impala查询优化器:执行计划生成与代价估算,解析验证至物理优化阶段实践探析 10-09 [转载]pgsql 无法删除表 CASCADE无效 09-22 蓝色通用科技网络公司响应式网站模板下载 09-03 清新宽屏按摩器展示官网html网站模板 08-04 黑色深邃电影资讯视频播放网站模板 05-23 jquery.pinBox-可将任何元素固定在容器中的jQuery插件 04-29 jQuery固定侧边栏插件ssMenu 03-14 ActiveMQ非持久订阅状态丢失问题:Broker重启影响与持久订阅解决方案 03-05 ActiveMQ线程池大小配置优化:系统资源限制下的性能与稳定性调优实践 02-24 简洁好看化妆品商城美容店铺购物网站模板 02-10 黄色自适应精密五金加工厂单页网站静态模板 01-07
时光飞逝
"流光容易把人抛,红了樱桃,绿了芭蕉。"