💎一站式轻松地调用各大LLM模型接口,支持GPT4、智谱、星火、月之暗面及文生图 广告
接下来一系列文章会对集群通信框架tribes进行源码级别的分析,欢迎讨论。 把若干机器组合成一个集群,集群为了能协同工作,成员之间的通信是必不可少的,当然可以说这也是集群实现中重点需要解决的核心问题,一个强大的通信协同机制是集群的基础。 简约地说,Tribes是一个具备让你通过网络向组成员发送和接收信息、动态检测发现其他节点的组通信能力的高扩展性的独立的消息框架。在组成员之间进行信息复制及成员维护是一个相对复杂的事情,因为不仅要考虑各种通信协议还要有必要的机制提供不同的消息传输保证级别,且成员关系的维护要及时准确,同时针对IO不同场景需提供不同的IO模式,这些都是组成员消息传输要遇到的需要深入考虑的几点。而Tribes很好地将点对点、点对组的通信抽象得即简单又相对灵活。 Tribes拥有消息可靠的传输机制,它默认基于TCP协议传输,TCP拥有三次握手机制保证且有流量控制机制,另外在应用层面的消息可靠保证分为三个级别: ①NO_ACK级别,这是可靠级别最低的方式,使用此种级别时则认为Tribes一旦把消息发送给socket的发送队列则认为发送成功,尽管传输过程中发生异常导致接收方可能没有接收到,当然这种级别也是发送最快的方式。 ②ACK级别,这是最推荐使用的一种方式,它能保证接收方肯定接能收到消息,Tribes向其他节点发送消息后只有接收到了接受者的确认消息才会认为发送成功,这种确认机制能在更高层面保证消息可靠性,不过发送效率会有影响,因为每个消息都需要确认,得不到确认的会重发。 ③SYNC_ACK级别,这种方式不仅保证传输成功还保证执行成功,Tribes向其他节点发送消息后接收者接收到不马上返回ACK确认而是对接收到的消息进行处理,直到处理成功才返回ACK确认。如果接收成功处理失败接收者会返回ACK_FAIL给发送者,发送者将会重发。当然这种级别消息发送效率是最低最慢的。  ![](https://box.kancloud.cn/2016-01-15_5698bd8d413a3.jpg) 整个Tribes的设计核心可以用上图表示,在IO层有三个重要的模块,其中MembershipService模块主要负责组成员关系的维护,包括维护现有成员及发现新成员,这些工作都是模块自动运行完成,你无需关心组成员的维护工作;ChannelSender模块负责向组内其他成员发送消息及其各种机制的详细实现;ChannelReceiver模块用于接收组内其他成员发送过来的消息及其各种机制的详细实现。消息的可靠性就是通过ChannelSender及ChannelReceiver的协同得到不同级别的保证的。拦截器栈提供了在消息传送到应用层之前对消息进行一些额外的操作,例如对某些信息进行过滤编码等等操作;最后到应用层,多数情况下我们只需关注应用层的东西即能使用起来,应用层面主要就是一些监听器,所以只要实现监听器里面指定的方法即可以对IO层传输上来的消息做逻辑处理。 拦截器、监听器的引入都是经典的模式,抽象一个底层作为数据处理层,实现各种复杂的通信及机制,而拦截器则是对底层数据的一种统一额外加工处理,监听器则作为接口提供应用层对数据做业务逻辑处理,组成了一个优雅的设计方案。 喜欢研究java的同学可以交个朋友: ![](https://box.kancloud.cn/2016-01-15_5698bd8d22882.jpg)