01 | 核心原理：能否画张图解释下RPC的通信流程？

2020-02-17 何小锋

RPC实战与核心原理

进入课程



讲述：张浩

时长12:05大小11.08M



你好，我是何小锋。只要你做过几年开发，那我相信 RPC 这个词你肯定是不陌生了。写专栏之前，我还特意查了下 RPC 的百度指数，发现这些年 RPC 的搜索趋势都是稳步上升的，这也侧面说明了这项技术正在逐步渗透到我们的日常开发中。作为专栏的第一讲，我想只围绕“RPC”这个词，和你聊聊它的定义，它要解决的问题，以及工作原理。
在前些年，我面试工程师的时候，最喜欢问候选人一个问题，“你能否给我解释下 RPC 的通信流程”。这问题其实并不难，不过因为很多工程师平时都在用各种框架，他们可能并未停下来思考过框架的原理，所以，问完这问题，有的人就犹豫了，吱唔了半天也没说出所以然来。
紧接着，我会引导他说，“你想想，如果没有 RPC 框架，那你要怎么调用另外一台服务器上的接口呢”。你看，这问题可深可浅，也特别考验候选人的基本功。如果你是候选人，你会怎么回答呢？今天我就来试着回答你这个问题。
什么是 RPC？我知道你肯定不喜欢听概念，我也是这样，看书的时候一看到概念就直接略过。不过，到后来，我才发现，“定义”是一件多么伟大的事情。当我们能够用一句话把一个东西给定义出来的时候，侧面也说明你已经彻底理解这事了，不仅知道它要解决什么问题，还要知道它的边界。所以，你可以先停下来想想，什么是 RPC。
RPC 的全称是 Remote Procedure Call，即远程过程调用。简单解读字面上的意思，远程肯定是指要跨机器而非本机，所以需要用到网络编程才能实现，但是不是只要通过网络通信访问到另一台机器的应用程序，就可以称之为 RPC 调用了？显然并不够。
我理解的 RPC 是帮助我们屏蔽网络编程细节，实现调用远程方法就跟调用本地（同一个项目中的方法）一样的体验，我们不需要因为这个方法是远程调用就需要编写很多与业务无关的代码。
这就好比建在小河上的桥一样连接着河的两岸，如果没有小桥，我们需要通过划船、绕道等其他方式才能到达对面，但是有了小桥之后，我们就能像在路面上一样行走到达对面，并且跟在路面上行走的体验没有区别。所以我认为，RPC 的作用就是体现在这样两个方面：
屏蔽远程调用跟本地调用的区别，让我们感觉就是调用项目内的方法；
隐藏底层网络通信的复杂性，让我们更专注于业务逻辑。
RPC 通信流程理解了什么是 RPC，接下来我们讲下 RPC 框架的通信流程，方便我们进一步理解 RPC。
如前面所讲，RPC 能帮助我们的应用透明地完成远程调用，发起调用请求的那一方叫做调用方，被调用的一方叫做服务提供方。为了实现这个的目标，我们就需要在 RPC 框架里面对整个通信细节进行封装，那一个完整的 RPC 会涉及到哪些步骤呢？
我们已经知道 RPC 是一个远程调用，那肯定就需要通过网络来传输数据，并且 RPC 常用于业务系统之间的数据交互，需要保证其可靠性，所以 RPC 一般默认采用 TCP 来传输。我们常用的 HTTP 协议也是建立在 TCP 之上的。
网络传输的数据必须是二进制数据，但调用方请求的出入参数都是对象。对象是肯定没法直接在网络中传输的，需要提前把它转成可传输的二进制，并且要求转换算法是可逆的，这个过程我们一般叫做“序列化”。
调用方持续地把请求参数序列化成二进制后，经过 TCP 传输给了服务提供方。服务提供方从 TCP 通道里面收到二进制数据，那如何知道一个请求的数据到哪里结束，是一个什么类型的请求呢？
在这里我们可以想想高速公路，它上面有很多出口，为了让司机清楚地知道从哪里出去，管理部门会在路上建立很多指示牌，并在指示牌上标明下一个出口是哪里、还有多远。那回到数据包识别这个场景，我们是不是也可以建立一些“指示牌”，并在上面标明数据包的类型和长度，这样就可以正确的解析数据了。确实可以，并且我们把数据格式的约定内容叫做“协议”。大多数的协议会分成两部分，分别是数据头和消息体。数据头一般用于身份识别，包括协议标识、数据大小、请求类型、序列化类型等信息；消息体主要是请求的业务参数信息和扩展属性等。
根据协议格式，服务提供方就可以正确地从二进制数据中分割出不同的请求来，同时根据请求类型和序列化类型，把二进制的消息体逆向还原成请求对象。这个过程叫作“反序列化”。
服务提供方再根据反序列化出来的请求对象找到对应的实现类，完成真正的方法调用，然后把执行结果序列化后，回写到对应的 TCP 通道里面。调用方获取到应答的数据包后，再反序列化成应答对象，这样调用方就完成了一次 RPC 调用。
那上述几个流程就组成了一个完整的 RPC 吗？
在我看来，还缺点东西。因为对于研发人员来说，这样做要掌握太多的 RPC 底层细节，需要手动写代码去构造请求、调用序列化，并进行网络调用，整个 API 非常不友好。
那我们有什么办法来简化 API，屏蔽掉 RPC 细节，让使用方只需要关注业务接口，像调用本地一样来调用远程呢？
如果你了解 Spring，一定对其 AOP 技术很佩服，其核心是采用动态代理的技术，通过字节码增强对方法进行拦截增强，以便于增加需要的额外处理逻辑。其实这个技术也可以应用到 RPC 场景来解决我们刚才面临的问题。
由服务提供者给出业务接口声明，在调用方的程序里面，RPC 框架根据调用的服务接口提前生成动态代理实现类，并通过依赖注入等技术注入到声明了该接口的相关业务逻辑里面。该代理实现类会拦截所有的方法调用，在提供的方法处理逻辑里面完成一整套的远程调用，并把远程调用结果返回给调用方，这样调用方在调用远程方法的时候就获得了像调用本地接口一样的体验。
到这里，一个简单版本的 RPC 框架就实现了。我把整个流程都画出来了，供你参考：
RPC 在架构中的位置围绕 RPC 我们讲了这么多，那 RPC 在架构中究竟处于什么位置呢？
如刚才所讲，RPC 是解决应用间通信的一种方式，而无论是在一个大型的分布式应用系统还是中小型系统中，应用架构最终都会从“单体”演进成“微服务化”，整个应用系统会被拆分为多个不同功能的应用，并将它们部署在不同的服务器中，而应用之间会通过 RPC 进行通信，可以说 RPC 对应的是整个分布式应用系统，就像是“经络”一样的存在。
那么如果没有 RPC，我们现实中的开发过程是怎样的一个体验呢？
所有的功能代码都会被我们堆砌在一个大项目中，开发过程中你可能要改一行代码，但改完后编译会花掉你 2 分钟，编译完想运行起来验证下结果可能要 5 分钟，是不是很酸爽？更难受的是在人数比较多的团队里面，多人协同开发的时候，如果团队其他人把接口定义改了，你连编译通过的机会都没有，系统直接报错，从而导致整个团队的开发效率都会非常低下。而且当我们准备要上线发版本的时候，QA 也很难评估这次的测试范围，为了保险起见我们只能把所有的功能进行回归测试，这样会导致我们上线新功能的整体周期都特别长。
无论你是研发还是架构师，我相信这种系统架构我们肯定都不能接受，那怎么才能解决这个问题呢？
我们首先都会想到可以采用“分而治之”的思想来进行拆分，但是拆分完的系统怎么保持跟未拆分前的调用方式一样呢？我们总不能因为架构升级，就把所有的代码都推倒重写一遍吧。
RPC 框架能够帮助我们解决系统拆分后的通信问题，并且能让我们像调用本地一样去调用远程方法。利用 RPC 我们不仅可以很方便地将应用架构从“单体”演进成“微服务化”，而且还能解决实际开发过程中的效率低下、系统耦合等问题，这样可以使得我们的系统架构整体清晰、健壮，应用可运维度增强。
当然 RPC 不仅可以用来解决通信问题，它还被用在了很多其他场景，比如：发 MQ、分布式缓存、数据库等。下图是我之前开发的一个应用架构图：
在这个应用中，我使用了 MQ 来处理异步流程、Redis 缓存热点数据、MySQL 持久化数据，还有就是在系统中调用另外一个业务系统的接口，对我的应用来说这些都是属于 RPC 调用，而 MQ、MySQL 持久化的数据也会存在于一个分布式文件系统中，他们之间的调用也是需要用 RPC 来完成数据交互的。
由此可见，RPC 确实是我们日常开发中经常接触的东西，只是被包装成了各种框架，导致我们很少意识到这就是 RPC，让 RPC 变成了我们最“熟悉的陌生人”。现在，回过头想想，我说 RPC 是整个应用系统的“经络”，这不为过吧？我们真的很有必要学好 RPC，不仅因为 RPC 是构建复杂系统的基石，还是提升自身认知的利器。
总结本讲我主要讲了下 RPC 的原理，RPC 就是提供一种透明调用机制，让使用者不必显式地区分本地调用和远程调用。RPC 虽然可以帮助开发者屏蔽远程调用跟本地调用的区别，但毕竟涉及到远程网络通信，所以这里还是有很多使用上的区别，比如：
调用过程中超时了怎么处理业务？
什么场景下最适合使用 RPC？
什么时候才需要考虑开启压缩？
无论你是一个初级开发者还是高级开发者，RPC 都应该是你日常开发过程中绕不开的一个话题，所以作为软件开发者的我们，真的很有必要详细地了解 RPC 实现细节。只有这样，才能帮助我们更好地在日常工作中使用 RPC。
课后思考
你应用中有哪些地方用到了 RPC？
你认为，RPC 使用过程中需要注意哪些问题？
欢迎留言和我分享你的思考和疑惑，也欢迎你把文章分享给你的朋友，邀请他加入学习。我们下节课再见！

开篇词 | 别老想着怎么用好RPC框架，你得多花时间琢磨原理

02 | 协议：怎么设计可扩展且向后兼容的协议？

 写留言

1716 143665 拼课微信(30)

楼下小黑哥

2020-02-18

我们目前服务内部调用都是使用 rpc，对外接口采用 restful 接口。
采用rpc 开发最终要我觉得是设置合理超时时间以及重试次数。因为 rpc毕竟需要走网络调用，存在网络耗时。超时间太短，可能导致服务提供端实际执行成功，消费端却因为超时报错结束。这就有可能导致数据状态不一致。

另外，整个链路的超时需要合理设置，如A-》B-〉C，A的超时时间要大于B。

重试次数也需要关注，默认情况下，如 dubbo 重试次数为2，调用失败的情况下，框架会重新调用。而有些服务不能重复调用。
服务提供者应该是最熟悉自己服务的，所以服务提供者可以设置默认超时时间以及重试次数，消费者不设置，就会采用服务提供者参数设置。
😅想了下，开发过程中其实还有好多细节要注意，细节决定成败，后面章节可以再聊聊，让我们跟老师一起学习。

展开

作者回复: 思路很好。



 10
忆水寒

2020-02-18

1、你应用中有哪些地方用到了 RPC？
答：我们目前系统进行拆分（C++开发的），也是分布式部署的，我们的RPC在系统间交互（或同步）数据时使用RPC接口进行调用。其次，我们RPC还是一个信息管家，可以通过事件进行提醒应用层主备机信息等。
2、你认为，RPC 使用过程中需要注意哪些问题？
答：这个问题让我想起了一次面试中面试官问我“你觉得一个设计RPC框架中最重要的是哪一点？”我当时首先说了RPC框架首先是通信、自定义协议（protobuf）、序列化、注册中心。我们的RPC由于C++开发的，只提供消息传输的功能，序列化和协议在应用层做的（主要是考虑不同项目的业务也有区别）。我觉得其中最重要的就是注册中心（数据中心）实现了，这个决定了RPC所能提供扩展功能。

展开

作者回复: 这些都是rpc的核心功能。

 2

 6
洛奇

2020-02-17

第一幅图中，编解码是一种码吗？
为什么序列化后生成编解码后还要再编码，才能放到网络上呢?
为什么不能直接一步序列化就放到网络上？

作者回复: 序列化是对方法调用的请求信息进行处理，编解码是对网络传输消息进行处理。

 3

 5
曌

2020-02-18

1. 你应用中有哪些地方用到了 RPC？
我们的应用是微服务架构的，RPC就是连接这些微服务之间的纽带。
2. 你认为，RPC 使用过程中需要注意哪些问题？
因为RPC也是网络调用，性能方面肯定不如本地调用，所有RPC的API设计要仔细考虑，比如一次性能完成的调用就不要走多次调用。另外我认为最重要的是要有监控系统能监控所有的调用链，方便问题排查和性能调优。

展开

作者回复: 👍👍👍



 2
Eclipse

2020-02-17

1 请求远程api接口，RESTful?
2 通讯的话，netty更适合做底层的事，rpc设计了部分业务治理？

展开

作者回复: 你好，eclipse。restful是一种常用的请求方式，在高性能，大并发的情况下，私有的rpc协议也很常用。如grpc，dubbo等。好的rpc总算要伴随治理才能完善。

 1

 2
阿卧

2020-02-23

1. 服务内部系统间交互时会经常用到rpc，例如创建订单的流程，订单中心调用业务系统的创单，并返回结果。
2. 要注意，rpc接口调用超时，接口访问量过高导致服务被拖垮等问题。

展开

作者回复: 是的



 1
Leon

2020-02-18

老师你好，最近在从零开始手写个RPC框架，深有感触。
实现了多种序列化机制，集成了protobuff、protostuff、json和hessian等。
目前在编码服务发现，基于zk，思路是有，不是太清晰，编码总是断断续续。
希望多点实战性的指导

展开

作者回复: 你好，leon。互相交流。都是我们实战的经验



 1
此鱼不得水

2020-02-18

希望老师可以详细讲解一下服务注册和发现的流程，目前网上很多的资料对这个部分都介绍的比较马虎。

作者回复: 后面有分享，需要解答的可以提问。

 1

 1
eason2017

2020-02-18

调用过程中超时了怎么处理业务？
重试机制，降级处理。
什么场景下最适合使用 RPC？
网络安全稳定的环境。
什么时候才需要考虑开启压缩？
压缩后，数据量有明显的降低，压缩会使用CPU等资源，还是要看性价比。

展开

作者回复: 👍

 1

 1
洛奇

2020-02-18

老师，RPC和RMI (远程方法调用) 有什么关系？

展开

作者回复: 目前没有关系，目标是一样，进行远程调用



 1
每天晒白牙

2020-02-17

服务调用的RPC框架
RPC在使用中需要接口的版本，比如服务提供方升级了接口，比如增加字段了。请求方没有修改接口的版本。这样调用就会出问题了。这个问题的根本属于协议内容，如果设计好的协议支持兼容扩展，一般是向下兼容，就能实现低版本的调用方照样调用高版本的服务方

展开

作者回复: 接口是契约，需要接口设计者做向下兼容

 3

 1
Geek_c8b5a1

2020-02-25

1、你应用中有哪些地方用到了 RPC？
在公司内部不同服务之间的调用都是走的RPC
2、你认为，RPC 使用过程中需要注意哪些问题？
1）下游服务的服务能力，避免因为你的调用把别人给调挂了，要事前协商好qps等，做好限流
2）调用服务异常时，要考虑降级、重试等措施
3）核心的服务不能强依赖非核心的服务，避免核心服务因为非核心服务异常而不可用

展开




小伟

2020-02-23

一个好的RPC框架需要可灵活配置的协议封装、高效准确的系列化/反序列化、强健高效的底层网络通信。还需要什么其他的呢？

展开

作者回复: 服务治理，动态配置等等




小伟

2020-02-23

我觉得广义来说，只要涉及调用的网络通信都属于RPC的范畴，包括Rest API，因为本质上都是走网络通信的非本地调用。
关于服务内部用RPC，服务外部用Rest API，主要考量的还是安全性。服务内部网络一般认为是相对安全的，因为已经有了很多手段来避免数据包外泄，故不需要强认证。而服务外部是对公网开放的，或至少部分是对公网开放的，数据在公网传输被认为是相对不安全的，所以要强认证。认证强弱的差别导致了RPC分成两派：针对服务内的高效的狭义RPC，和针对服务外的相对低效的RPC(Rest API)。
早在EJB的时代，有个叫RMI的东西，流程和RPC惊人的一致，只不过RMI还需要调用方维护大量底层细节，感觉RPC是从RMI发展来的，是好用版RMI。

展开

作者回复: 外部用restful，主要是http协议标准，浏览器支持简单。而不是安全。都可以采用ssl加密




felix

2020-02-22

建议老师，回复不要再加“您好，用户ID”了，用户ID非常干扰回复内容，谢谢。

作者回复: 👌




(Kelen)

2020-02-21

老师你好，有个想法，我们在熟悉rpc过程中，我体会到，把概念最好解释清楚的方法之一是结合实际例子。就像算法学习一样，比如rpc,老师可以概念后面结合一个自己手写的简单的rpc，然后贴上各种代码。这样读者会不会更清楚，课下也可以练习

展开

作者回复: 解决一个场景需要大量的代码。不是简单的贴一点代码




cricket1981

2020-02-21

只要存在client server通讯就需要rpc，对吗？知名rpc框架底层用的都是netty吗？

作者回复: rpc用于远程通信，client+server就是这样的场景。netty是java里面网络通信的最著名框架。




Geek_68236a

2020-02-20

dubbo中的RPC实现，提供者的服务和调用者声明的函数是怎么映射的

作者回复: 调用者请求的数据包里面有协议，接口，分组，方法和参数信息，服务提供者解析出数据包，会从当前服务里面查找对应实例来调用




阳🌏Y(^_^)Y☀️...

2020-02-20

网站应用互相调用用的都是RESTful API，在学习各类分布式框架和计算引擎的时候基本随时都会看到RPC

作者回复: 网站对外用http和浏览器交互，内部可以使用rpc。




crown

2020-02-20

工作中哪里用到了rpc？
    我是做游戏服务器开发的，有多个网关，多个业务处理服务器，玩家socket和某个确定的网关连接，网关和多个业务服务器连接。
   玩家发出请求，网关把请求转发给确定的业务服务器(也可以rpc调用)，业务服务器把处理结果返回给网关，网关再转发给客户端。
    重点是:如果网关和业务服务器rpc调用出现了超时后的处理。希望能从本专栏学到点rpc知识应用到游戏服务器框架设计。

展开

作者回复: 你好，crown。调用方的超时时间可以传递到服务。如果超时了，服务端可以尽快的释放资源，不必再处理已经超时的请求





