
Java Agent在中间件安全领域的应用(文末附详细代码)
1、什么是java agent
Java Agent又叫做Java探针,是在JDK1.5引入的一种可以动态修改Java字节码的技术,是依附于java应用程序(JVM)Instrumentation API与虚拟机交互。
Java类编译之后形成字节码被JVM执行,在JVM在执行这些字节码之前获取这些字节码信息,并且通过字节码转换器对这些字节码进行修改,来完成一些额外的功能
底层的具体由JVMTI机制实现。
JVM tool interface(JVMTI)是供工具使用的本机编程接口。它提供了一种检查状态和控制Java虚拟机(JVM)中运行的应用程序执行的方法。JVMTI支持需要访问JVM状态的各种工具,包括但不限于:分析、调试、监视、线程分析和覆盖率分析工具。
2、使用场景
java agent技术的一些常用使用场景:
- 对class文件加密
- 实现应用性能监控(APM)
- JAVA程序的调试
- 热加载
- 启动方式
在java主程序中,通过-javaagent指定代理jar包,来实现程序代理。**-javaagent:jarpath[=**options]
jarpath是代理JAR文件的路径。options是代理选项。此开关可以在同一命令行上多次使用,从而创建多个代理。多个代理可以使用同一jarpath。代理JAR文件必须符合JAR文件规范。
3、启动方式
挂载agent的方式主要包含静态启动、动态启动两种方式。
3.1 静态启动(Agent模式)
当在JVM启动时,来指定代理。需要实现的方法premain()
启动agent
3.2 动态启动(Attach模式)
当在JVM启动一段时间后,来指定代理。基于动态attach模式,需要实现方法 agentmain。
需要通过VirtualMachine将加载agent的jar,插装到需要代理的JVM进程中,来实现代理操作。
启动agent命令,因为要依赖java toos.jar,需要显示指定classpath。具体做法如下所示:
命令的具体参数说明如下:
- agentArgs: java agent启动指定的传入的参数,如:java -agentlib:/data/agent.jar=opt1,opt2
- inst:它提供了向现有编译的Java类添加字节码的能力
编写完AttachAgent,还不能直接被jvm加载,首先需要在 在resources/META-INF/MANIFREST.MF文件加入如下配置
然后要在maven中定义agent配置:
对这些配置项说明如下:
- Premain-Class:包含premain方法的类名,当在JVM静态启动时指定代理时,需要此属性
- Agent-Class:包含agentmain方法的类。当在JVM动态启动时指定代理时,需要此属性
- Boot-Class-Path:引导类加载器要搜索的路径列表。路径表示目录或库(在许多平台上通常称为JAR或zip库)。在查找类的平台特定机制失败后,引导类加载器会搜索这些路径。列表中的路径由一个或多个空格分隔。路径采用层次URI的路径组件的语法。如果路径以斜杠字符(“/”)开头,则路径为绝对路径,否则路径为相对路径。根据代理JAR文件的绝对路径解析相对路径。忽略格式不正确和不存在的路径。当在VM启动后某个时间启动代理时,将忽略不表示JAR文件的路径。此属性是可选的。
- Can-Redefine-Classes:重新定义此代理所需的类的能力。返回:true/false,默认false
- Can-Retransform-Classes:是否能够重新转换此代理所需的类。返回:true/false,默认false
- Can-Set-Native-Method-Prefix:是否设置此代理所需的本机方法前缀的能力。返回:true/false,默认false
接下来我们再来看一下java agent技术中一个非常重要的类:Instrumentation,是实现动态修改字节码的主力军,对其中非常重要的方法一一介绍下作用。
- transformer 所有满足ClassFileTransformers的类,在初始化过程中,都会调用转换器(除了任何注册的转换器所依赖的类的定义)。转换器可以修改目标类的字节码,从而达到重新定义类功能的能力。对于已经加载的类,需要借助retransform来实现重新触发类转换
- retransform 注册的Transformer会在类初始化过程中,一个一个去将满足条件的类进行转换。retransfrom是JVM重复执行这个过程的能力。Instrumentation的retransformClasses方法只提供类,不通过类字节码,它是通过将已经注册的具有转换能力的ClassFileTransformers,提供实际字节码,来达到修改目标类的能力。使用场景是在目标类已经加载(如agent attach模式),对目标类进行修改。
- redefine 代理类可以在任何时候,通过指定目标类和类字节码,将来达到修改目标类,redefineClasses更改现有(和已加载)类的实际定义
4、卸载Agent
在javaagent不管是通过agent模式还是通过attach模式,都将本身agent代码也加载到目标JVM中。
在我们不需要对目标JVM代理,想要使目标class恢复到代理之前应该如果去操作呢?
首先卸载javaagent包括如下途径。当然最快的卸载agent方式是直接将目标JVM进程重启,但是这种方式对于高可用业务场景,可能会带来风险。
我们通常有如下两种方式进行类的卸载。
4.1 卸载Transform
第一种是卸载Transform。
如果我们是通过定义Transformer来实现javaagent,那么可以使用retransform将Transformer移除,并且将被代理class恢复。
具体的实施步骤如下:
- 在premain或者agentmain中,注册Transformer
- 触发retransform使类重新加载,从而修改目标class字节码,生成新的被代理class。其中clazz变量是被代理类对象
- 通过removeTransformer移除已经注册的Transformer,并且再次触发retransform,使被代理class字节码还原到代理之前。其中helloTransformer必须是第一步定义的Transformer对象引用。
4.2 通过热部署能力实现还原目标代理类
通过redefine,直接将代码进行重新加载,达到类覆盖的目的。实现方式为Instrumentation#redefineClasses(ClassDefinition classDefinition)方法,通过提供的类字节码,重新定义类。
这种方法不仅能够还原被代理的类,同时也能实现代理依赖的类,根据指定的类直接吗,重新加载为新的class,这样就可以实现agent.jar的热部署。
5、完整Demo示范
5.1 定义Agent代理类:HelloAgent
通过mainAgent代理类,实现类扩展功能,默认只能生效修改还未加载的类。
但是一般我们在对程序类进行代理时,大多已经运行一段时间,处理代码已经完成加载。在这个时候,需要将已经加载的类进行替换,在attach到目标进程后,通过调用Instrumentation#redefineClasses让jvm重新加载指定类,这样就完成已加载类型字节码修改。
5.2 定义类转换器:Transformer
5.3 定义Agent注入入口
这一步,只有动态启动(attatch)模式需要,静态启动不需要定义此类。
5.4 pom依赖
javassist是一个用来 处理 Java 字节码的类库。它可以在一个已经编译好的类中添加新的方法,或者是修改已有的方法。
maven-shade-plugin会将项目依赖打到jar中
5.5 定义一个需要被注入的程序
5.6 分别使用两种方式启动
- javaagent(静态启动方式) 静态启动是随着java主程序一起启动,伴随jvm的生命周期
输出:
- javaagent(动态启动方式)
启动主程序,此时程序正常输出结果
其中需要先查看example.jar的pid。com.vhicool.demo.AttachAgent是attach模式启动程序,agent.jar 是代理程序
输出结果如下所示:
文章转载自公众号:中间件兴趣圈
