手撕Dubbo源码,彻底理解RPC原理

davisl
发布于 2022-9-28 11:34
浏览
0收藏

在《服务治理篇-应用架构的演变》中提到在分布式服务架构中,用于提高业务复用及整合的分布式服务框架(RPC)是关键。Dubbo是其中的典型代表。

 

今天咱们就来手撕Dubbo源码,来达到彻底了解其本质的目的。

 

 

Dubbo怎样实现远程过程通信

 

手撕代码之前咱们来做一个宏观上的认知。

手撕Dubbo源码,彻底理解RPC原理-鸿蒙开发者社区

上面是Dubbo的部署架构。注册中心、配置中心、元数据中心这三大中心化组件的各自的职责、工作方式如下:

 

●  注册中心。协调 Consumer 与 Provider 之间的地址注册与发现
●  配置中心。
    ◆  存储 Dubbo 启动阶段的全局配置,保证配置的跨环境共享与全局一致性
    ◆  负责服务治理规则(路由规则、动态配置等)的存储与推送。
●  元数据中心。
    ◆  接收 Provider 上报的服务接口元数据,为 Admin 等控制台提供运维能力(如服务测试、接口文档等)
    ◆  作为服务发现机制的补充,提供额外的接口/方法级别配置信息的同步能力,相当于注册中心的额外扩展

以上三个中心并不是运行 Dubbo 的必要条件,用户完全可以根据自身业务情况决定只启用其中一个或多个,以达到简化部署的目的。通常情况下,所有用户都会以独立的注册中心 开始 Dubbo 服务开发,而配置中心、元数据中心则会在微服务演进的过程中逐步地按需被引入进来。

 

下面是Dubbo早期的架构,这个架构核心组件只包含注册中心,基本就是运行Dubbo的最简架构。而注册中心也是异步弱依赖,唯一的强依赖是4. invoke这一步。也就是RPC调用发起请求到下游的部分。

手撕Dubbo源码,彻底理解RPC原理-鸿蒙开发者社区

Dubbo源码-场景设定

 

下面来手撕Dubbo的核心源码。为了好理解,这里讲Dubbo默认的dubbo协议使用http协议做说明。

手撕Dubbo源码,彻底理解RPC原理-鸿蒙开发者社区

下面的代码想达到的效果如上图,先来说说思路:

1.  先要有服务提供者,注册到注册中心。注册中心本质上就是服务提供者的访问地址存储的地方。只是这个url不一定是http协议的地址,本质都是应用层协议地址,并没有什么不同。
2.  服务提供者要指明一个服务的实现类。
3.  服务提供者开启网络通信服务,将服务暴露出去。
4.  服务消费者找到对应的服务
5.  服务消费者发起调用

 

先来设计一个场景,要暴露的服务端如下:

 

服务的接口

手撕Dubbo源码,彻底理解RPC原理-鸿蒙开发者社区

实现类

手撕Dubbo源码,彻底理解RPC原理-鸿蒙开发者社区

以上咱们用服务提供者端核心5行代码、服务消费者端核心5行代码来实现。

 

Dubbo源码-服务提供者

 

五行代码

 

简单来说就是注册并暴露服务。按照这个思路咱们不难得到下面的提供端代码框架。这里面共5行有效代码,咱们一行一行来解释。

手撕Dubbo源码,彻底理解RPC原理-鸿蒙开发者社区

第一行

 

回到主线代码第一行有效代码,封装了一个url对象,这个是自己写的:

手撕Dubbo源码,彻底理解RPC原理-鸿蒙开发者社区

就是一个主机名端口的存储简单对象。

 

第二行

 

第二行有效代码作用是将url注册到远程注册中心上,咱们脑补一下注册中心的存储大概如下所示:

手撕Dubbo源码,彻底理解RPC原理-鸿蒙开发者社区

这里咱用一个map来模拟注册中心,不难得到下面的代码。

手撕Dubbo源码,彻底理解RPC原理-鸿蒙开发者社区

save是写文件来模拟的,这块不是重点,为了完整性简单提一下。

手撕Dubbo源码,彻底理解RPC原理-鸿蒙开发者社区

第三行

 

第三行有效代码作用是指明接口对应的实现类,这个实现时也使用map数据结构。本质上就是一个存取。

手撕Dubbo源码,彻底理解RPC原理-鸿蒙开发者社区

第四行

 

第四行有效代码是获取协议。作为一个框架来说需要具有多协议的支持,这里做了一个简单的实现。

手撕Dubbo源码,彻底理解RPC原理-鸿蒙开发者社区

协议的接口规定了两个动作,一个是启动时做的事情,一个是发送时做的事情。

手撕Dubbo源码,彻底理解RPC原理-鸿蒙开发者社区

第五行

 

先不着急看实现,先回到主线代码第五行。第五行就是把url传入后调用协议的start。这时候咱们来看启动方法的实现:

手撕Dubbo源码,彻底理解RPC原理-鸿蒙开发者社区

就是启动了一个httpServer。咱们来看httpServer.start的具体实现。这里面就是启动了一个tomcat。关键点是加了一个DispatcherServlet,并对所有的请求进行拦截处理。重点我用红框标出来了

手撕Dubbo源码,彻底理解RPC原理-鸿蒙开发者社区

这里本质上说明了web容器和servlet的核心作用。web容器主要是负责网络通信,servlet是java应用内部路由分发。咱们来看看路由分发是怎么做的:

手撕Dubbo源码,彻底理解RPC原理-鸿蒙开发者社区

咱们来分析一下HttpServerHandler.handler方法是怎么实现。分三步:

手撕Dubbo源码,彻底理解RPC原理-鸿蒙开发者社区

第一步,解析请求输入流。

第二步,解析出要调用的接口,从本地注册缓存中获取实现类。

第三步,利用java反射机制将解释出的请求参数传入实现类发起真正调用。

 

以上就完成了服务暴露的整个过程。

 

Dubbo源码-服务消费者

 

五行代码

 

客户端调用的整个过程比较简单,分成两步:

1.  通过代理找到实现类
2.  发起调用

手撕Dubbo源码,彻底理解RPC原理-鸿蒙开发者社区

关键逻辑就是代理如何实现:

手撕Dubbo源码,彻底理解RPC原理-鸿蒙开发者社区

第一行

 

第一行有效代码:封装Invacation对象,将接口名、方法名、方法参数传入。

手撕Dubbo源码,彻底理解RPC原理-鸿蒙开发者社区

第二行

 

第二行有效代码:从注册中心获取url列表

 

第三行

 

第三行代码,因为获取到的是url列表,怎么选择发往哪个呢?这里采用的是随机算法决定发往的地址,这也是dubbo默认的地址选择策略。

手撕Dubbo源码,彻底理解RPC原理-鸿蒙开发者社区

第四行

 

第四行是获取协议,在服务提供端介绍过了,直接往下。

 

第五行

 

第五行是通过协议将invacation对象发送到url上。

手撕Dubbo源码,彻底理解RPC原理-鸿蒙开发者社区

看看httpProtocal内部是怎么实现的。

手撕Dubbo源码,彻底理解RPC原理-鸿蒙开发者社区

内部很简单,就是调用httpClient把请求发出去。虽然这个httpClient是自己写的,但是实际上功能和开源的那个差不多。咱们简单看一下就好:

手撕Dubbo源码,彻底理解RPC原理-鸿蒙开发者社区

总结

 

在《mybatis的本质和原理》中,我手撕了一个简易却包含mybatis核心的代码,来探究mybatis的本质原理。这一篇呢,我手撕了一个Dubbo的源码,是不是也没有那么难。

 

再来回顾一下今天讲述的代码完整链路:

手撕Dubbo源码,彻底理解RPC原理-鸿蒙开发者社区

服务提供者端将将接口注册到注册中心,并指明对应的实现类。通过tomcat、netty等实现网络通信,将服务暴露出去。内部使用servlet等实现路由在收到消费端请求时找到对应的实现类。

 

服务消费者使用从注册中心获取url列表,使用随机数等算法找到一个url,将参数、方法名当做http等协议的请求请求参数发起调用。

 

现在大家闭上眼睛想一想,Dubbo框架的核心原理是不是了然于胸了~

 

 

分类
已于2022-9-28 11:42:04修改
收藏
回复
举报
回复
    相关推荐