Spark RPC概述中我们介绍了Spark RPC接口的设计和使用,spark1.6版本中RPC底层实现使用netty,并在后续2.x版本中彻底移除了akka,因此,我们看下Spark RPC内部如何使用netty的。
查看SparkContext中创建RpcEnv的代码 查看对应的RpcEnv.create方法
上一节最后讲到调用startNettyRpcEnv方法启动netty server,而startNettyRpcEnv调用的是NettyRpcEnv.startServer,查看对应方法
调用transportContext的createServer方法启动 netty server,TransportContext用来创建server和clientFactory,下面会讲,查看createServer方法
根据上面截图,createServer执行了如下步骤 1. new TransportServer实例。 2. TransportServer构造器中调用init方法。 3. init方法中启动netty server(不熟悉netty点这里Netty User guide for 4.x)。 到这里,我们跟踪了spark 如何启动netty server。
spark对netty做了封装,在spark-network-common模块,如下 1. TransportContext持有启动netty需要的上下文环境TransportConf,主要作用是创建TransportServer和TransportClientFactory。 2. TransportServer通过构造函数启动netty,提供底层通信服务。 3. TransportClientFactory用来创建TransportClient。 4. TransportClient用以和对应的TransportServer通信。 此外还有用于处理信息的MessageEncoder、MessageDecoder、RpcHandler等,这些和netty的具体使用紧密相关,不作介绍,请参考Netty User guide for 4.x,关于spark-network-common更多信息参考Spark Network Common的实现。
介绍了以下两部分内容: 1. spark中启动netty的过程,即创建RpcEnv时,通过TransportContext实例化TransportServer,TransportServer构造器中启动netty。 2. spark对netty的封装,主要包括TransportContext、TransportContext、TransportClientFactory和TransportClient。
新闻热点
疑难解答