消息队列 · PHP知识整理

## 消息队列（Message Queue） “消息”是在两台计算机间传送的数据单位。消息可以非常简单，例如只包含文本字符串；也可以更复杂，包括对象等。队列是一种数据结构，先进先出，保证了顺序性。生产者：发送消息的一端。用于把消息写入到队列中消费者：从消息队列中，依次读取每条消息的一端。消息队列中间件是分布式系统中重要的组件，主要解决应用耦合，异步消息，流量削锋等问题。实现高性能，高可用，可伸缩和最终一致性架构。是大型分布式系统不可缺少的中间件。目前在生产环境，使用较多的消息队列有ActiveMQ，RabbitMQ，ZeroMQ，Kafka，MetaMQ，RocketMQ等。 ### 应用场景 #### 1. 异步处理场景说明：用户注册后，需要发注册邮件和注册短信。传统的做法有两种 1.串行的方式；2.并行方式（1）串行方式：将注册信息写入数据库成功后，发送注册邮件，再发送注册短信。以上三个任务全部完成后，返回给客户端 ![img](https://box.kancloud.cn/a4722c87d2bfb4741e6e09badbe16f9a_519x132.png) （2）并行方式：将注册信息写入数据库成功后，发送注册邮件的同时，发送注册短信。以上三个任务完成后，返回给客户端。与串行的差别是，并行的方式可以提高处理的时间 ![img](https://box.kancloud.cn/12212ac8b03a43e7e57c27336c1888f9_399x212.png) 假设三个业务节点每个使用50毫秒钟，不考虑网络等其他开销，则串行方式的时间是150毫秒，并行的时间可能是100毫秒。因为CPU在单位时间内处理的请求数是一定的，假设CPU1秒内吞吐量是100次。则串行方式1秒内CPU可处理的请求量是7次（1000/150）。并行方式处理的请求量是10次（1000/100）引入消息队列，将不是必须的业务逻辑，异步处理。改造后的架构如下： ![img](https://box.kancloud.cn/dd995082e48fe862c37d15596c9be28e_570x189.png) 按照以上约定，用户的响应时间相当于是注册信息写入数据库的时间，也就是50毫秒。注册邮件，发送短信写入消息队列后，直接返回，因此写入消息队列的速度很快，基本可以忽略，因此用户的响应时间可能是50毫秒。因此架构改变后，系统的吞吐量提高到每秒20 QPS。比串行提高了3倍，比并行提高了两倍 #### 2. 应用解耦场景说明：用户下单后，订单系统需要通知库存系统。传统的做法是，订单系统调用库存系统的接口。如下图： ![img](http://static.codeceo.com/images/2016/02/4a63d31c026678ec4f5e4c65615524a5.png) 传统模式的缺点： 1）假如库存系统无法访问，则订单减库存将失败，从而导致订单失败； 2）订单系统与库存系统耦合；如何解决以上问题呢？引入应用消息队列后的方案，如下图 ![img](https://box.kancloud.cn/c40c937ca48ca88bf0aacd4a9d623311_346x179.png) - 订单系统：用户下单后，订单系统完成持久化处理，将消息写入消息队列，返回用户订单下单成功。 - 库存系统：订阅下单的消息，采用拉/推的方式，获取下单信息，库存系统根据下单信息，进行库存操作。 - 假如：在下单时库存系统不能正常使用。也不影响正常下单，因为下单后，订单系统写入消息队列就不再关心其他的后续操作了。实现订单系统与库存系统的应用解耦。 #### 3. 流量削峰流量削锋也是消息队列中的常用场景，一般在秒杀或团抢活动中使用广泛。应用场景：秒杀活动，一般会因为流量过大，导致流量暴增，应用挂掉。为解决这个问题，一般需要在应用前端加入消息队列。 1. 可以控制活动的人数； 2. 可以缓解短时间内高流量压垮应用； ![img](https://box.kancloud.cn/d123ddf6bc7c6fadeda9df1af89fbb61_436x113.png) 1. 用户的请求，服务器接收后，首先写入消息队列。假如消息队列长度超过最大数量，则直接抛弃用户请求或跳转到错误页面； 2. 秒杀业务根据消息队列中的请求信息，再做后续处理。 #### 4. 日志处理日志处理是指将消息队列用在日志处理中，比如Kafka的应用，解决大量日志传输的问题。架构简化如下： ![img](https://box.kancloud.cn/5c7955b0c51ecda2961ad61bed720dc2_456x109.png) - 日志采集客户端，负责日志数据采集，定时写受写入Kafka队列； - Kafka消息队列，负责日志数据的接收，存储和转发； - 日志处理应用：订阅并消费kafka队列中的日志数据； #### 5. 消息通讯消息通讯是指，消息队列一般都内置了高效的通信机制，因此也可以用在纯的消息通讯。比如实现点对点消息队列，或者聊天室等。点对点通讯： ![img](https://box.kancloud.cn/0bb9e200762927f7d7f0e49075b98dd0_406x109.png) 客户端A和客户端B使用同一队列，进行消息通讯。聊天室通讯： ![img](https://box.kancloud.cn/abe430706ba7ddfa4589e47f05e6ec73_406x117.png) 客户端A，客户端B，客户端N订阅同一主题，进行消息发布和接收。实现类似聊天室效果。以上实际是消息队列的两种消息模式，点对点或发布订阅模式。 ### 消息中间件实例 #### 电商系统 ![img](https://box.kancloud.cn/aa48531af00dc5f7cd1b82de89f11894_403x172.jpg) 消息队列采用高可用，可持久化的消息中间件。比如Active MQ，Rabbit MQ，Rocket Mq。（1）应用将主干逻辑处理完成后，写入消息队列。消息发送是否成功可以开启消息的确认模式。（消息队列返回消息接收成功状态后，应用再返回，这样保障消息的完整性）（2）扩展流程（发短信，配送处理）订阅队列消息。采用推或拉的方式获取消息并处理。（3）消息将应用解耦的同时，带来了数据一致性问题，可以采用最终一致性方式解决。比如主数据写入数据库，扩展应用根据消息队列，并结合数据库方式实现基于消息队列的后续处理。 #### 日志收集系统 ![img](https://box.kancloud.cn/14a9ebd2812d8edf80e50d9a989c4239_545x200.jpg) 分为Zookeeper注册中心，日志收集客户端，Kafka集群和Storm集群（OtherApp）四部分组成。 - Zookeeper注册中心，提出负载均衡和地址查找服务 - 日志收集客户端，用于采集应用系统的日志，并将数据推送到kafka队列 - Kafka集群：接收，路由，存储，转发等消息处理 Storm集群：与OtherApp处于同一级别，采用拉的方式消费队列中的数据 ### 消息模型 JMS标准中，有两种消息模型P2P（Point to Point）,Publish/Subscribe(Pub/Sub)。 #### P2P（点对点）模式 ![img](https://box.kancloud.cn/f7ba4cfde70afd3957642ff79febbf29_874x452.jpg) P2P模式包含三个角色：消息队列（Queue），发送者(Sender)，接收者(Receiver)。每个消息都被发送到一个特定的队列，接收者从队列中获取消息。队列保留着消息，直到他们被消费或超时。 P2P的特点 - 每个消息只有一个消费者（Consumer）(即一旦被消费，消息就不再在消息队列中) - 发送者和接收者之间在时间上没有依赖性，也就是说当发送者发送了消息之后，不管接收者有没有正在运行，它不会影响到消息被发送到队列 - 接收者在成功接收消息之后需向队列应答成功如果希望发送的每个消息都会被成功处理的话，那么需要P2P模式 #### Pub/sub模式消息生产者（发布）将消息发布到topic中，同时有多个消息消费者（订阅）消费该消息。和点对点方式不同，发布到topic的消息会被所有订阅者消费。 ![img](https://box.kancloud.cn/b1f77b42862fedee4c603a973c4e34f2_926x488.jpg) 包含三个角色主题（Topic），发布者（Publisher），订阅者（Subscriber）多个发布者将消息发送到Topic,系统将这些消息传递给多个订阅者。 Pub/Sub的特点 - 每个消息可以有多个消费者 - 发布者和订阅者之间有时间上的依赖性。针对某个主题（Topic）的订阅者，它必须创建一个订阅者之后，才能消费发布者的消息 - 为了消费消息，订阅者必须保持运行的状态为了缓和这样严格的时间相关性，JMS允许订阅者创建一个可持久化的订阅。这样，即使订阅者没有被激活（运行），它也能接收到发布者的消息。如果希望发送的消息可以不被做任何处理、或者只被一个消息者处理、或者可以被多个消费者处理的话，那么可以采用Pub/Sub模型 ### 流行模型对比传统企业型消息队列ActiveMQ遵循了JMS规范，实现了点对点和发布订阅模型，但其他流行的消息队列RabbitMQ、Kafka并没有遵循JMS规范。 #### RabbitMQ RabbitMQ实现了AQMP协议，AQMP协议定义了消息路由规则和方式。生产端通过路由规则发送消息到不同queue，消费端根据queue名称消费消息。 RabbitMQ既支持内存队列也支持持久化队列，消费端为推模型，消费状态和订阅关系由服务端负责维护，消息消费完后立即删除，不保留历史消息。（1）点对点生产端发送一条消息通过路由投递到Queue，只有一个消费者能消费到。 ![img](https://box.kancloud.cn/a32c03a1e00648ec29c4751239ca2efc_1104x494.jpg) （2）多订阅当RabbitMQ需要支持多订阅时，发布者发送的消息通过路由同时写到多个Queue，不同订阅组消费不同的Queue。所以支持多订阅时，消息会多个拷贝。 ![img](https://box.kancloud.cn/b60de06b03a7be0371354891027c5f62_1236x740.jpg) #### Kafka Kafka只支持**消息持久化**，消费端为拉模型，消费状态和订阅关系由客户端端负责维护，消息消费完后不会立即删除，会保留历史消息。因此支持多订阅时，消息只会存储一份就可以了。但是可能产生重复消费的情况。（1）点对点&多订阅发布者生产一条消息到topic中，不同订阅组消费此消息。 ![img](https://box.kancloud.cn/9cc2cfecb2d63118e269a41845a39259_1238x738.jpg)