RocketMQ事务消息如何保证数据的一致性

开发 前端
分布式事务是大厂面试必问题,而目前大部分公司都是采用可靠消息来保证数据的最终一种性,通常会采用 RocketMQ 来实现。如果想去阿里的同学,建议 MQ 这块,选择 RocketMQ 多复习一下。

[[385043]]

本文转载自微信公众号「菜鸟飞呀飞」,作者刘进坤。转载本文请联系菜鸟飞呀飞公众号。  

前言

在面过的几家大厂中,几乎每轮的面试官(「没写错,几乎是每轮面试官」)都问了同样一个问题:你们的系统是分布式的系统吗?

答:是。

面试官:那么你们分布式的系统是如何解决分布式事务这个问题的呢?也就是如何保证数据的一致性。

答:我们的系统中通过 RocketMQ 的事务消息来保证数据的最终一致性。

面试官:那你说说它是如何来保证数据的最终一致性的?

答:分两部分来回答,第一部分先回答事务消息的实现流程,第二部分解释为什么它能保证数据的最终一致性。

事务消息的实现流程

事务消息

  1. 首先服务 A 发送一个半事务消息(也称 half 消息)至 MQ 中。为什么要先发送一个 half 消息呢?这是为了保证服务 A 和 MQ 之间的通信正常,如果无法正常通信,则服务 A 可以直接返回一个异常,也就不用处理后面的逻辑的了。
  2. 如果 half 消息发送成功,MQ 收到这个 half 消息后,会返回一个 success 响应给服务 A。
  3. 服务 A 接收到 MQ 返回的 success 响应后,开始处理本地的业务逻辑,并提交本地事务。
  4. 如果服务 A 本地事务提交成功,则会向 MQ 中发送 commit,表示将 half 消息提交,MQ 就会执行第 5 步操作;如果服务 A 本地事务提交失败,则直接回滚本地事务,并向 MQ 中发送 rollback,表示将之前的 half 消息进行回滚,MQ 接收到 rollback 消息后,就会将 half 消息删除。
  5. 如果 commit,则将 half 消息写入到磁盘。
  6. 如果 MQ 长时间没有接收到 commit 或者 rollback 消息,例如:服务 A 在处理本地业务时宕机了,或者发送的 commit、rollback 因为在弱网环境,数据丢失了。那么 MQ 就会在一定时间后尝试调用服务 A 提供的一个接口,通过这个接口来判断 half 消息的状态。所以服务 A 提供的接口,需要实现的业务逻辑是:通过数据库中对应数据的状态来判断,之前的 half 消息对应的业务是否执行成功。如果 MQ 从这个接口中得知 half 消息执行成功了,那么 MQ 就会将 half 消息持久化到本地磁盘,如果得知没有执行成功,那么就会将 half 消息删除。
  7. 服务 B 从 MQ 中消费到对应的消息。
  8. 服务 B 处理本地业务逻辑,然后提交本地事务。

如何保证数据的最终一致性

实现流程说完了,可能你现在有各种各样的疑惑?

Q: half 消息是个啥?

A: 它和我们正常发送的普通消息是一样的,都是存储在 MQ 中,唯一不同的是 half 在 MQ 中不会立马被消费者消费到,除非这个 half 消息被 commit 了。(至于为什么未 commit 的 half 消息无法被消费者读取到,这是因为在 MQ 内部,对于事务消息而言,在 commit 之前,会先放在一个内部队列中,只有 commit 了,才会真正将消息放在消费者能读取到的 topic 队列中)

Q: 为什么要先发送 half 消息?

A: 前面已经解释过了,主要是为了保证服务 A 和 MQ 之间是否能正常通信,如果两者之间都不能正常通信,后面还玩个锤子,直接返回异常就可以了。

Q: 如果 MQ 接收到了 half 消息,但是在返回 success 响应的时候,因为网络原因,导致服务 A 没有接收到 success 响应,这个时候是什么现象?

A: 当服务 A 发送 half 消息后,它会等待 MQ 给自己返回 success 响应,如果没有接收到,那么服务 A 也会直接结束,返回异常,不再执行后续逻辑。不执行后续逻辑,这样服务 A 也就不会提交 commit 消息给 MQ,MQ 长时间没接收到 commit 消息,那么它就会主动回调服务 A 的一个接口,服务 A 通过接口,查询本地数据后,发现这条消息对应的业务并没有正常执行,那么就告诉 MQ,这个 half 消息不能 commit,需要 rollback,MQ 知道后,就将 half 消息进行删除。

Q: 如果服务 A 本地事务执行失败了,怎么办?

A: 服务 A 本地事务执行失败后,先对自己本地事务进行回滚,然后再向 MQ 发送 rollback 操作。

Q: 服务 A 本地事务提交成功或失败后,向 MQ 发送的 commit 或者 rollback 消息,因为网络问题丢失了,又该怎么处理?

A: 和上一个问题一样,MQ 长时间没有接收到 half 消息的 commit 或者 rollback 消息,MQ 会主动回调服务 A 的接口,通过这个接口来判断自己该对这个 half 消息如何处理。

Q: 前面说的全是事务消息的实现流程,这和事务消息如何保证数据的最终一致性有什么关系呢?

A: 有关系。首先,服务 A 执行本地事务并提交和向 MQ 中发送消息这是两个写操作,然后通过 RocketMQ 的事务消息,我们保证了这两个写操作要么都执行成功,要么都执行失败。然后让其他系统,如服务 B 通过消费 MQ 中的消息,然后再去执行自己本地的事务,这样到最后,服务 A 和服务 B 这两个系统的数据状态是不是达到了一致?这就是最终一致性的含义。

如果要求服务 A 和服务 B 的数据状态,在服务 A 返回给客户端之间,这两者就达到一致,这是强一致性,RocketMQ 是没法保证强一致性的。

目前通过「可靠消息来保证数据的最终一致性」是很多大厂都采用的方案,基本都是通过 MQ 和补偿机制来保证数据的一致性。(所谓的可靠消息,就是消息不丢失,如何保证 MQ 的消息不丢失,下篇文章会写,这也是面试常考题)

Q: 服务 B 本地事务提交失败了,怎么办?

A: 如果服务 B 本地事务提交失败了,可以进行多次重试,直到成功。如果重试多次后,还是提交失败,例如此时服务 B 对应的 DB 宕机了,这个时候只要服务 B 不向 MQ 提交本次消息的 offset 即可。如果不提交 offset,那么 MQ 会在一定时间后,继续将这条消息推送给服务 B,服务 B 就可以继续执行本地事务并提交了,直到成功。这样,依旧是保证了服务 A 和服务 B 数据的最终一致性。

代码实现

使用 RokcetMQ 的事务消息主要涉及到两个部分:

如何发送半事务消息,这个可以通过「TransactionMQProducer」 类来实现。

  1. TransactionMQProducer transactionMQProducer = new TransactionMQProducer("producerGroup"); 
  2. TransactionSendResult result = transactionMQProducer.sendMessageInTransaction(msg, null); 
  3. // 通过result来判断half消息是否发送成功 
  4. if(result.getSendStatus() == SendStatus.SEND_OK){ 
  5.     // 成功 
  6. }else
  7.     // 失败 

在前面我们提到了服务 A 需要提供一个接口,用来供 MQ 回调服务 A,实际上这个接口就是一个监听器:「TransactionListener」的方法。这是一个接口,提供了两个方法。

  1. public interface TransactionListener { 
  2.  
  3.      // 当half消息发送成功后,我们在这里实现自己的业务逻辑,然后commit或者rollback 给MQ 
  4.     LocalTransactionState executeLocalTransaction(final Message msg, final Object arg); 
  5.  
  6.  
  7.      // 这个方法就是供MQ回调的方法,MQ通过回调该方法来判断half消息的状态 
  8.      // 可以看到,这个方法的参数是MessageExt,也就是half消息的内容,如果根据MessageExt,我们完全能在服务A中判断之前的业务是否处理成功 
  9.     LocalTransactionState checkLocalTransaction(final MessageExt msg); 

实际使用时,我们需要实现该接口,例如:

  1. public class MyTransactionListener implements TransactionListener { 
  2.  
  3.     @Override 
  4.     public LocalTransactionState executeLocalTransaction(Message msg, Object arg) { 
  5.         try{ 
  6.             // 处理业务逻辑 
  7.             // .... 
  8.  
  9.             // 业务逻辑处理成功,commit 
  10.             return LocalTransactionState.COMMIT_MESSAGE; 
  11.         }catch (Exception e){ 
  12.  
  13.         } 
  14.         // 业务处理失败,rollback 
  15.         return LocalTransactionState.ROLLBACK_MESSAGE; 
  16.     } 
  17.  
  18.     @Override 
  19.     public LocalTransactionState checkLocalTransaction(MessageExt msg) { 
  20.         return null
  21.     } 

另外,在创建 producer 时,指定我们实现实现的监听器

  1. TransactionMQProducer transactionMQProducer = new TransactionMQProducer("producerGroup"); 
  2. transactionMQProducer.setTransactionListener(new MyTransactionListener()); 

总结

分布式事务是大厂面试必问题,而目前大部分公司都是采用可靠消息来保证数据的最终一种性,通常会采用 RocketMQ 来实现。如果想去阿里的同学,建议 MQ 这块,选择 RocketMQ 多复习一下。

 

责任编辑:武晓燕 来源: 菜鸟飞呀飞
相关推荐

2019-08-30 12:46:10

并发扣款查询SQL

2022-10-19 12:22:53

并发扣款一致性

2023-09-07 08:11:24

Redis管道机制

2023-10-08 08:29:31

2023-11-07 07:32:46

RocketMQ数据一致性

2020-08-05 08:46:10

NFS网络文件系统

2023-05-26 07:34:50

RedisMySQL缓存

2022-03-29 10:39:10

缓存数据库数据

2021-12-14 07:15:57

MySQLRedis数据

2024-01-10 08:01:55

高并发场景悲观锁

2024-01-22 08:52:00

AQS双异步数据一致性

2020-01-02 09:06:23

微服务数据框架

2022-04-06 15:19:32

数据库MySQL一致性

2020-06-01 22:09:48

缓存缓存同步缓存误用

2024-01-15 10:38:20

多级缓存数据一致性分布式缓存

2021-07-21 15:50:42

Serverless 业务部署

2023-12-01 13:51:21

数据一致性数据库

2022-07-21 06:54:28

微服务系统RocketMQ

2020-04-01 15:50:17

TiDBMySQL数据库

2023-09-15 14:24:54

ByteHouseClickHouse开源
点赞
收藏

51CTO技术栈公众号