服务器其他   发布时间:2022-05-15  发布网站:大佬教程  code.js-code.com
大佬教程收集整理的这篇文章主要介绍了MySQL 5.7并行复制实践大佬教程大佬觉得挺不错的,现在分享给大家,也给大家做个参考。

《MysqL 5.7并行复制实践》要点:
本文介绍了MysqL 5.7并行复制实践,希望对您有用。如果有疑问,可以联系我们。

@H_538_1@mysqL 5.7并行复制原理

@H_570_6@mysqL 从 5.6 开始引入了多库并行主从复制,但是其并行只是基于 scheR_949_11845@a 的,也就是基于库的.如果用户的 MysqL 数据库实例中存在多个 scheR_949_11845@a,对于从机复制的速度的确可以有比较大的帮助.MysqL 5.6 并行复制的架构如下所示:

MySQL 5.7并行复制实践

在上图的红色框框部分就是实现并行复制的关键所在.在 MysqL 5.6 版本之前,Slave 服务器上有两个线程 I/O 线程和 sql 线程.I/O 线程负责接收二进制日志(更准确的说是二进制日志的 event ),sql 线程进行回放二进制日志.如果在 MysqL 5.6 版本开启并行复制功能,那么sql线程就变为了 Coordinator 线程,Coordinator线程主要负责以前两部分的内容:

  • 若判断可以并行执行,那么选择 Worker 线程执行事务的二进制日志.
  • 若判断不可以并行执行,如该操作是 DDL,亦或者是事务跨 scheR_949_11845@a 操作,则等待所有的 Worker 线程执行完成之后,再执行当前的日志.

这意味着 Coordinator 线程并不是仅将日志发送给 Worker 线程,自己也可以回放日志,但是所有可以并行的操作交付由 Worker 线程完成.Coordinator 线程与 Worker 是典型的生产者与消费者模型.

上述机制实现的基于 scheR_949_11845@a 的并行复制存在两个问题,首先是 Crash Safe 功能不好做,因为可能之后执行的事务由于并行复制的关系先完成执行,那么当发生 Crash 的时候,这部分的处理逻辑是比较复杂的.从代码上看,5.6 这里引入了 Low-Water-Mark 标记来解决该问题,从设计上看,其是希望借助于日志的幂等性来解决该问题,不过 5.6 的二进制日志回放还不能实现幂等性.另一个最为关键的问题是这样设计的并行复制效果并不高,如果用户实例仅有一个库,那么就无法实现并行回放,甚至性能会比原来的单线程更差.而单库多表是比多库多表更为常见的一种情形.

@H_570_6@mysqL 5.7 才可称为真正的并行复制,这其中最为主要的原因就是 Slave 服务器的回放与主机是一致的即 Master 服务器上是怎么并行执行的 Slave 上就怎样进行并行回放.不再有库的并行复制限制,对于二进制日志格式也无特殊的要求(基于库的并行复制也没有要求).

从 MysqL 官方来看,其并行复制的原本计划是支持表级的并行复制和行级的并行复制,行级的并行复制通过解析 ROW 格式的二进制日志的方式来完成.但是最终出现的是在开发计划中称为:@H_77_11@mTS: Prepared transactions slave parallel applier.

该并行复制的思想最早是由 MariaDB 的 Kristain 提出,并已在 MariaDb 10 中出现,MysqL 5.7 并行复制的思想简单易懂,一言以蔽之:一个组提交的事务都是可以并行回放,因为这些事务都已进入到事务的 Prepare 阶段,则说明事务之间没有任何冲突(否则就不可能提交).

为了兼容 MysqL 5.6 基于库的并行复制,5.7 引入了新的变量 slave-parallel-type,其可以配置的值有:

  • DATABASE:默认值,基于库的并行复制方式.
  • LOGICAL_CLOCK:基于组提交的并行复制方式.

如何知道事务是否在一组中,又是一个问题,因为原版的 MysqL 并没有提供这样的信息.在 MysqL 5.7版本中,其设计方式是将组提交的信息存放在 GTID 中.那么如果用户没有开启 GTID 功能,即将参数 gtid_mode 设置为 OFF 呢?故 MysqL 5.7 又引入了称之为 Anonymous_Gtid 的二进制日志 event 类型,如:

这意味着在 MysqL 5.7 版本中即使不开启 GTID,每个事务开始前也是会存在一个 Anonymous_Gtid,而这 GTID 中就存在着组提交的信息.

上面是没有开启组提交的一个日志,我们可以看得到 binlog 当中有两个参数 last_committedsequence_number,我们可以看到,下一个事务在主库配置好组提交以后,last_committed 永远都和上一个事务的 sequence_number 是相等的.这也很容易理解,因为事务是顺序提交的.

下面看一下组提交模式的事务:

我们可以看到最后两个事务的 last_committed 是相同的,这意味着这两个事务是作为一个组提交的,两个事务在 Perpare 阶段获取相同的 last_committed 而且相互不影响,最终是会作为一个组进行提交.这就是所谓的组提交.组提交的事务是可以在从机进行并行回放的.

上述的 last_committedsequence_number 代表的就是所谓的 LOGICAL_CLOCK.

配置MysqL并行复制

环境准备

这里一共使用了二台机器,MysqL 版本都为 5.7.18.

MySQL 5.7并行复制实践

安装MysqL

@H_570_6@mysqL 安装比较简单,在 「MysqL 5.7多源复制实践」一文中我们也讲了,这里就不在重复讲了.如果你还不会安装,可以先参考此文安装好 MysqL .

启用MysqL并行复制

@H_570_6@mysqL 5.7的并行复制建立在组提交的基础上,所有在主库上能够完成 Prepared 的语句表示没有数据冲突,就可以在 Slave 节点并行复制.

关于 MysqL 5.7 的组提交,我们要看下以下的参数:

要开启 MysqL 5.7 并行复制需要以下二步,首先在主库设置 binlog_group_commit_sync_delay 的值大于0 .

@H_77_11@mysqL> set global binlog_group_commit_sync_delay=10;

这里简要说明下 binlog_group_commit_sync_delaybinlog_group_commit_sync_no_delay_count 参数的作用.

binlog_group_commit_sync_delay

binlog_group_commit_sync_no_delay_count

其次要在 Slave 主机上设置如下几个参数:

或者直接在线启用也是可以的

检查Worker线程的状态

当前的 Slave 的 sql 线程为 Coordinator(协调器),执行 Relay log 日志的线程为 Worker(当前的 sql 线程不仅起到协调器的作用,同时也可以重放 Relay log 中主库提交的事务).

我们上面设置的线程数是 4,从库就能看到 4 个 Coordinator(协调器)进程.

MySQL 5.7并行复制实践

并行复制配置与调优

开启 MTS 功能后,务必将参数 @H_77_11@master-info-repository 设置为 TABLE,这样性能可以有 50%~80% 的提升.这是因为并行复制开启后对于 @H_77_11@master.info 这个文件的更新将会大幅提升,资源的竞争也会变大.

在 MysqL 5.7 中,推荐将 @H_77_11@master-info-repository 和 relay-log-info-repository 设置为 TABLE,来减小这部分的开销.

并行复制监控

复制的监控依旧可以通过 SHOW SLAVE STATUS\G,但是 MysqL 5.7 在 perfoRMANce_scheR_949_11845@a 架构下多了以下这些元数据表,用户可以更细力度的进行监控:

文章来自微信公众号:运维之美

大佬总结

以上是大佬教程为你收集整理的MySQL 5.7并行复制实践全部内容,希望文章能够帮你解决MySQL 5.7并行复制实践所遇到的程序开发问题。

如果觉得大佬教程网站内容还不错,欢迎将大佬教程推荐给程序员好友。

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。
标签: