MQ实战 | RocketMQ不同可用区导致消费不均衡
创始人
2025-05-03 09:12:14
0

[[416753]]

一、现象反馈

业务同学反馈有个服务在部署容器后不间断收到积压告警,该服务对积压敏感,影响派单的时效性。原来部署到ECS上的服务没有积压情况,准备往容器迁移。下面是业务同学做的排除测试,另外容器当前在J/K可用区部署,而MQ集群部署在B/G/F区。

  • 回退到原ECS部署积压消失
  • 在原可用区申请扩容ECS未出现积压
  • 在新的可用区J/K申请ECS出现积压

备注: 很明显该积压与可用区有关系。

二、积压监控

在迁移容器的过程中,同时有容器消费和ECS消费的节点,通过分区积压进行对比。

ECS消费分区积压监控

备注: 明显ECS的节点没有什么积压。

容器消费分区积压监控

备注: 积压较多的分区分布在容器节点。

三、可用区耗时监控

J/F可用区延迟

G/B/K可用区延迟

备注: J/K区的延迟比其他可用区多0.5ms左右。

四、解决措施

既然由于可用区延迟引起,可以考虑一下几种措施:

1.将MQ集群迁移到J/K可用区

由于其他可用区还有重要业务,明显不可行。

2.将容器发布部署非J/K可用区

容器可以相对考虑可用区的均衡性,但是难以避免不同可用区混部,也不太可行。

3.提高消费能力 

通过提高部署容器节点和增加消费线程池大小来提高消费能力可以起到立竿见影的效果。

本文转载自微信公众号「瓜农老梁」,可以通过以下二维码关注。转载本文请联系瓜农老梁公众号。

 

相关内容

热门资讯

如何允许远程连接到MySQL数... [[277004]]【51CTO.com快译】默认情况下,MySQL服务器仅侦听来自localhos...
如何利用交换机和端口设置来管理... 在网络管理中,总是有些人让管理员头疼。下面我们就将介绍一下一个网管员利用交换机以及端口设置等来进行D...
施耐德电气数据中心整体解决方案... 近日,全球能效管理专家施耐德电气正式启动大型体验活动“能效中国行——2012卡车巡展”,作为该活动的...
Windows恶意软件20年“... 在Windows的早期年代,病毒游走于系统之间,偶尔删除文件(但被删除的文件几乎都是可恢复的),并弹...
20个非常棒的扁平设计免费资源 Apple设备的平面图标PSD免费平板UI 平板UI套件24平图标Freen平板UI套件PSD径向平...
德国电信门户网站可实时显示全球... 德国电信周三推出一个门户网站,直观地实时提供其安装在全球各地的传感器网络检测到的网络攻击状况。该网站...
着眼MAC地址,解救无法享受D... 在安装了DHCP服务器的局域网环境中,每一台工作站在上网之前,都要先从DHCP服务器那里享受到地址动...
为啥国人偏爱 Mybatis,... 关于 SQL 和 ORM 的争论,永远都不会终止,我也一直在思考这个问题。昨天又跟群里的小伙伴进行...