初识中间件之消息队列

时间:2017-02-25 13:40:05   收藏:0   阅读:164

初识中间件之消息队列

1 消息队列概述

消息队列是分布式系统中的重要组件,主要解决应用耦合,异步消息,流量削锋等问题,以实现高性能,高可用,可伸缩和最终一致性架构,是大型分布式系统中不可缺少的中间件。

目前使用较多的消息队列有ActiveMQ,RabbitMQ,ZeroMQ,Kafka,MetaMQ,RocketMQ等,比如我之前用过的RabbitMQ以及kafka。

2 消息队列应用场景

在实际应用中,消息队列常用于异步处理、应用解耦、流量削锋和消息通讯这四个场景。

2.1 异步处理

用户注册后,需要发注册邮件和注册短信。传统的做法有两种:1.串行;2.并行。

假设三个业务节点,每个使用50ms,不考虑网络等其他开销,则串行方式的时间是150ms,并行的时间可能是100ms。

因为CPU在单位时间内处理的请求数是一定的,假设CPU1秒内吞吐量是1次,则串行方式1秒内CPU可处理的请求量是7次(1000/150),并行方式处理的请求量是10次(1000/100)。

小结:如以上案例描述,传统方式系统的性能(并发量,吞吐量,响应时间)会有瓶颈。如何解决这个问题呢?

引入消息队列,将不是必须的业务逻辑进行异步处理。改造后的架构如下:


注册邮件和发送短信写入消息队列后,直接返回,因此写入消息队列的速度很快,基本可以忽略,预估为5ms,再加上注册信息写入数据库的时间50ms,总体响应时间就只有55ms。可见架构改变后,系统的TPS提高到了20(1000/55),比串行提高了3倍,比并行提高了2倍。

 

2.2 应用解耦

用户下单后,订单系统需要通知库存系统。传统的做法是,订单系统调用库存系统的接口,如图所示:

 

传统模式的缺点:

如何解决以上问题呢?引入消息队列后的方案如下图所示:

技术分享

 

2.3 流量削锋

流量削锋也是消息队列中的常用场景,一般在秒杀或团抢活动中使用广泛。

秒杀活动,可能会因为流量暴增而导致应用挂掉。为了解决这个问题,一般需要在应用前端加入消息队列,这样做的用处有:

2.4 日志处理

日志处理是指将消息队列用在日志处理中,比如Kafka的应用,解决大量日志传输的问题。架构简化如下:

       技术分享

以下是新浪的Kafka日志处理应用案例:

技术分享

2.5 消息通讯

消息队列一般都内置了高效的通信机制,因此也可以用于单纯的消息通讯,比如实现点对点消息队列或者聊天室等。

客户端A和客户端B使用同一队列,进行消息通讯。

客户端A,客户端B,客户端N订阅同一主题,进行消息发布和接收,即可实现类似聊天室的效果。

3 消息中间件示例

3.1 电商系统

 

消息队列采用高可用,可持久化的消息中间件,比如Active MQ,Rabbit MQ以及Rocket Mq。

3.2日志收集系统

 

分为Zookeeper注册中心、日志收集客户端、Kafka集群和Storm集群(OtherApp)四部分组成。

4 JMS消息服务

讲消息队列就不得不提JMS 。JMS(JAVA Message Service,Java消息服务)API是一个消息服务的标准/规范,允许应用程序组件基于JavaEE平台创建、发送、接收和读取消息。它使分布式通信耦合度更低,消息服务更加可靠以及异步性。

在EJB架构中,有消息Bean可以无缝地与JM消息服务集成。在J2EE架构模式中,有消息服务者模式,用于实现消息与应用直接的解耦。

4.1消息模型

在JMS标准中,有两种消息模型P2P(Point to Point)和Publish/Subscribe(Pub/Sub)。

4.1.1 P2P模式

 

P2P模式包含三个角色:消息队列(Queue),发送者(Sender)以及接收者(Receiver)。每个消息都被发送到一个特定的队列,接收者从队列中获取消息。队列保留着消息,直到他们被消费或超时。我们的跨境电商项目目前用的就是这种模式。

P2P的特点:

如果希望发送的每个消息都会被成功处理的话,那么需要P2P模式。

4.1.2 Pub/Sub模式

包含三个角色:主题(Topic),发布者(Publisher)以及订阅者(Subscriber)。多个发布者将消息发送到Topic,系统将这些消息传递给多个订阅者。

Pub/Sub的特点:

为了缓和这样严格的时间相关性,JMS允许订阅者创建一个可持久化的订阅。这样,即使订阅者没有被激活(运行),它也能接收到发布者的消息。

如果希望发送的消息可以不被做任何处理、或者只被一个消息者处理、或者可以被多个消费者处理的话,那么可以采用Pub/Sub模型。

4.2 消息消费

在JMS中,消息的产生和消费都是异步的,JMS的消费者可以通过两种方式来消费消息。

JNDI:Java命名和目录接口,是一种标准的Java命名系统接口。可以在网络上查找和访问服务。通过指定一个资源名称,该名称对应于数据库或命名服务中的一个记录,同时返回资源连接建立所必须的信息。

JNDI在JMS中起到查找和访问发送目标或消息来源的作用。

4.3 JMS编程模型

(1) ConnectionFactory

创建Connection对象的工厂,针对两种不同的JMS消息模型,分别有QueueConnectionFactory和TopicConnectionFactory两种。可以通过JNDI来查找ConnectionFactory对象。

(2) Destination

Destination的意思是消息生产者的消息发送目标或者说消息消费者的消息来源。对于消息生产者来说,它的Destination是某个队列(Queue)或某个主题(Topic);对于消息消费者来说,它的Destination也是某个队列或主题(即消息来源)。

所以,Destination实际上就是两种类型的对象:Queue、Topic可以通过JNDI来查找Destination。

(3) Connection

Connection表示在客户端和JMS系统之间建立的链接(对TCP/IP Socket的包装)。Connection可以产生一个或多个Session。跟ConnectionFactory一样,Connection也有两种类型:QueueConnection和TopicConnection。

(4) Session

Session是操作消息的接口。可以通过Session创建生产者、消费者、消息等。Session提供了事务的功能。当需要使用Session发送/接收多个消息时,可以将这些发送/接收动作放到一个事务中。同样,也分QueueSession和TopicSession。

(5) 消息的生产者

消息生产者由Session创建,并用于将消息发送到Destination。同样,消息生产者分两种类型:QueueSender和TopicPublisher。可以调用消息生产者的方法(send或publish方法)发送消息。

(6) 消息消费者

消息消费者由Session创建,用于接收被发送到Destination的消息。两种类型:QueueReceiver和TopicSubscriber。可分别通过Session的createReceiver(Queue)或createSubscriber(Topic)来创建。当然,也可以使用Session的creatDurableSubscriber方法来创建持久化的订阅者。

(7) MessageListener

消息监听器。如果注册了消息监听器,一旦消息到达,将自动调用监听器的onMessage方法。EJB中的MDB(Message-Driven Bean)就是一种MessageListener。

5 常用消息队列

一般商用的容器,比如WebLogic,JBoss,都支持JMS标准,开发上很方便。但免费的比如Tomcat,Jetty等则需要使用第三方的消息中间件。本部分内容介绍常用的消息中间件(Rabbit MQ,Rabbit MQ,Zero MQ,Kafka)以及它们的特点。

5.1 RabbitMQ

RabbitMQ是流行的开源消息队列系统,用erlang语言开发。RabbitMQ是AMQP(高级消息队列协议)的标准实现,支持多种客户端,如:Python、Ruby、.NET、Java、JMS、C、PHP、ActionScript、XMPP、STOMP等,支持AJAX,持久化。用于在分布式系统中存储转发消息,在易用性、扩展性、高可用性等方面表现不俗。我们的跨境电商项目选用的消息队列就是RabbitMQ。

结构图如下:

技术分享

几个重要概念:

消息队列的使用过程如下:

(1)生产者和消费者连接到消息队列服务器,打开一个Channel;

(2)生产者和消费者声明一个Exchange,并设置相关属性;

(3)生产者和消费者声明一个Queue,并设置相关属性;

(4)生产者和消费者使用Routing Key,在Exchange和Queue之间建立好绑定关系;

(5)生产者投递消息到Exchange。Exchange接收到消息后,就根据消息的Key和已经设置的Binding进行消息路由,将消息投递到一个或多个队列里;

(6)消费者从队列读取消息进行消费。

5.2 ActiveMQ

ActiveMQ 是Apache出品,最流行的,能力强劲的开源消息总线。ActiveMQ 是一个完全支持JMS1.1和J2EE 1.4规范的 JMS Provider实现,尽管JMS规范出台已经是很久的事情了,但是JMS在当今的J2EE应用中仍然扮演着特殊的地位。

ActiveMQ特性如下:

5.3 ZeroMQ

号称史上最快的消息队列,它实际类似于Socket的一系列接口,跟Socket的区别是:普通的Socket是端到端的(1:1的关系),而ZeroMQ却是可以N:M 的关系,人们对BSD套接字的了解较多的是点对点的连接,点对点连接需要显式地建立连接、销毁连接、选择协议(TCP/UDP)和处理错误等,而ZeroMQ屏蔽了这些细节,让网络编程更为简单。ZeroMQ用于Node与Node间的通信,Node可以是主机或者是进程。

引用官方的说法: “ZeroMQ是一个简单好用的传输层,像框架一样的一个Socket Library,它使得Socket编程更加简单、简洁和高性能。同时也是一个消息处理队列库,可在多个线程、内核和主机盒之间弹性伸缩。ZeroMQ的明确目标是“成为标准网络协议栈的一部分,之后进入Linux内核”。现在还未看到它们的成功。但是,它无疑是极具前景的、并且是人们更加需要的“传统”BSD套接字之上的一层封装。ZeroMQ让编写高性能网络应用程序极为简单和有趣。”

特点如下:

与RabbitMQ相比,ZeroMQ并不像是一个传统意义上的消息队列服务器,事实上,它也根本不是一个服务器,更像一个底层的网络通讯库,在Socket API之上做了一层封装,将网络通讯、进程通讯和线程通讯抽象为统一的API接口。支持“Request-Reply “,”Publisher-Subscriber“,”Parallel Pipeline”三种基本模型和扩展模型。

ZeroMQ高性能设计要点:

5.4 Kafka

Kafka是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者规模的网站中的所有动作流数据。 这种动作(网页浏览,搜索和其他用户的行动)是在现代网络上的许多社会功能的一个关键因素。 这些数据通常是由于吞吐量的要求而通过日志聚合和分析来解决。对于像Hadoop一样的日志数据离线分析系统,如果有实时处理的需求,Kafka就是一个可行的解决方案。Kafka的目的是通过Hadoop的并行加载机制来统一线上和离线的消息处理,也是为了通过集群机来提供实时的消费。

Kafka是一种高吞吐量的分布式发布订阅消息系统,有如下特性:

Kafka相关概念:

Kafka一般在大数据日志处理或对实时性(少量延迟)、可靠性(少量丢数据)要求稍低的场景使用。

  文章为本人原创

禁止其他公众账号转载

技术分享

原文:http://www.cnblogs.com/andashu/p/6441512.html

评论(0
© 2014 bubuko.com 版权所有 - 联系我们:wmxa8@hotmail.com
打开技术之扣,分享程序人生!