• 阿里二面:聊聊 MySQL 主从同步方案的优缺点

阿里二面:聊聊 MySQL 主从同步方案的优缺点

2025-05-06 10:00:09 栏目:宝塔面板 293 阅读

大家好,我是君哥。今天来聊一聊 MySQL 主从架构。

MySQL Replication 是 MySQL 官方提供的主从同步方案,用于将 MySQL 主库的数据同步到从库中,从库可以供应用程序读取数据。

1.简介

Replication 是目前 MySQL 使用最多的灾备方案,主要有 3 个作用:

  • 读写分离,写主库读从库。这样大大降低主库的负载,即使主库出现类似锁表之类的情况,也不影响应用读取数据。
  • 实现灾备,当主库发生故障时,可以方便地把从库切换成主库,实现高可用(HA)。
  • 水平扩展,当应用访问量导致数据库 I/O 高时,可以通过水平扩展的方式将降低单机负载,降低磁盘 I/O。

下面是一个 MySQL Replication 的案例。

图片

在上面的例子中,有一个主库,三个从库,通过 Replication,主库生成 events 的 binlog 发给 slave,Slave 将收到的 binlog 拷贝到 relaylog,然后解析 relaylog 中的命令进行执行,实现主从数据同步。

2.同步原理

MySQL 通过 binlog 实现同步过程中,会用到 3 个线程:

  • IO thread: 从库执行 START SLAVE 语句时,会创建一个 IO thread,负责连接主节点,请求更新的 binlog,接收到 binlog 后写入 relaylog;
  • dump thread:主库接收到从库的 binlog 请求后,创建一个 dump thread,把 binlog 同步给从库;
  • sql thread:读取 relaylog,解析 relaylog 的命令并执行,将数据落库。

整个同步流程如下:

图片

  • 在从库上执行 change master 命令,设置要连接主库的用户名、密码、ip、端口以及请求同步的 binlog 中的位置,这个位置包含文件名和binlog offset;
  • 从库执行 start slave 命令,这时会启动上面的 IO thread 和 sql thread,其中 IO thread 负责跟主库建立连接;
  • 主库收到从库的连接请求后,校验用户名密码;
  • 主库校验通过后创建 dump thread,按照从库请求 binlog 的 offset 将 binlog 发给从库;
  • 从库收到主库发送的 binlog 后,将日志写入 relaylog;
  • sql thread 读取 relaylog,解析出命令后执行。

3.优缺点

前面讲到,主从同步有读写分离、实现灾备、水平扩展等优点。那主从同步有哪些缺点呢?最大的缺点就是主从延迟

导致主从延迟的主要原因如下:

  • 从库所在机器性能差,命令执行慢;
  • 从库查询压力大,消耗了大量 CPU 资源,影响了 sql thread 执行;
  • 主库有大事务(比如大表DDL),这个事务里面执行的 sql 比较多,一方面主库需要等待事务执行完成才能写入 binlog,另一方面同步到从库和在从库执行都需要花费很多时间,导致主从延迟;
  • 数据库版本低,在 MySQL 5.6 之前,只支持单线程复制,效率比较低;
  • 表上无主键,主库利用索引更改数据,从库只能用全表扫描。

要解决主备延迟的问题,可以考虑下面方法:

  • 优化业务逻辑,避免使用大事务,或者大事务场景尽量放在业务低峰期执行;
  • 提高从库所在机器的性能;
  • 保障网络性能,避免网络延迟;
  • 引入 semi-sync 半同步复制,配合异步复制。

主从同步的第二个缺点就是数据丢失

MySQL 有 3 种主从复制方式:

  • 异步复制:主库执行完客户端提交的事务后立即将结果返回给客户端,不关心从库是否同步完成。这种方式很容易发生数据丢失,比如主库的日志还未同步给从库就宕机了,这时需要在从库中选择一个作为新主库,之前未同步完成的数据就丢失了;
  • 全同步复制:主库执行完客户端提交的事务并且等待从库也执行完成数据同步后再把结果返回给客户端。这种方式能够保证不丢失数据,但是数据库的性能会受到影响;
  • 半同步复制:是介于全同步和异步复制的一种方式,主库至少等待一个从库接收 binlog 并成功写入到 relaylog 后给客户端返回结果。主库不需要等待所有从库返回 ACK。

MySQL 中默认采用异步复制,这样很容易导致数据丢失。一个好的方式就是采用 semi-sync 半同步复制插件。不过 semi-sync 存在一个问题,主库写数据到 binlog 后执行 commit,才会给从库同步数据。如果从库还没有返回 ACK,主库发生了宕机,从库还没有写完 relaylog 就被选择为主库,也会发生数据丢失。

为了解决这个问题,MySQL 5.7 引入了增强版半同步复制。主库写入数据到 binlog 后,就给从库进行同步,直到至少一个从库返回给主库 ACK,主库才会进行 commit 操作。

4.总结

本文介绍了 MySQL 主从同步方案的优缺点,希望能对你使用和理解 MySQL 有所帮助。

本文地址:https://www.yitenyun.com/182.html

搜索文章

Tags

数据库 API FastAPI Calcite 电商系统 MySQL Web 应用 异步数据库 数据同步 ACK 双主架构 循环复制 JumpServer SSL 堡垒机 跳板机 HTTPS TIME_WAIT 运维 负载均衡 HexHub Docker JumpServer安装 堡垒机安装 Linux安装JumpServer Deepseek 宝塔面板 Linux宝塔 生命周期 esxi esxi6 root密码不对 无法登录 web无法登录 服务器 管理口 序列 核心机制 Windows Windows server net3.5 .NET 安装出错 HTTPS加密 服务器性能 查看硬件 Linux查看硬件 Linux查看CPU Linux查看内存 宝塔面板打不开 宝塔面板无法访问 开源 PostgreSQL 存储引擎 Windows宝塔 Mysql重置密码 Oracle 处理机制 无法访问宝塔面板 InnoDB 数据库锁 连接控制 机制 监控 Spring Redis 异步化 Serverless 无服务器 语言 ES 技术 Undo Log group by 索引 SQL 优化 万能公式 协同 缓存方案 缓存架构 缓存穿透 分页查询 高可用 动态查询 机器学习 GreatSQL 连接数 工具 响应模型 查询 日志文件 MIXED 3 scp Linux的scp怎么用 scp上传 scp下载 scp命令 R edis 线程 SVM Embedding 锁机制 数据 主库 R2DBC 加密 场景 Netstat Linux 服务器 端口 openHalo 云原生 RocketMQ 长轮询 配置 Linux 安全 Postgres OTel Iceberg 存储 AI 助手 ​Redis 推荐模型 SQLite-Web SQLite 数据库管理工具 Recursive 自定义序列化 共享锁 SQLark 向量数据库 大模型 PG DBA Hash 字段 OB 单机版 Ftp 电商 系统 国产数据库 启动故障 架构 数据分类 MySQL 9.3 • 索引 • 数据库 修改DNS Centos7如何修改DNS 人工智能 推荐系统 流量 防火墙 黑客 磁盘架构 sftp 服务器 参数 redo log 重做日志 分库 分表 Rsync 同城 双活 信息化 智能运维 线上 库存 预扣 业务 不宕机 Python 向量库 Milvus MVCC 传统数据库 向量化 行业 趋势 mini-redis INCR指令 Canal 缓存 聚簇 非聚簇 PostGIS 高效统计 今天这篇文章就跟大家 网络架构 网络配置 INSERT COMPACT Doris SeaTunnel Redisson 锁芯 数据备份 事务 Java 开发 prometheus Alert filelock 语句 窗口 函数 Web 虚拟服务器 虚拟机 内存 ZODB RDB AOF MongoDB 数据结构 读写 引擎 性能 核心架构 订阅机制 Go 数据库迁移 数据脱敏 加密算法 容器 失效 IT运维 数据类型 B+Tree ID 字段 OAuth2 Token 频繁 Codis 分布式 集中式 模型 崖山 新版本 发件箱模式 容器化 网络故障 Redis 8.0 SSH 聚簇索引 非聚簇索引 播客 微软 SQL Server AI功能 自动重启 MCP 开放协议 DBMS 管理系统 QPS 高并发 SpringAI 数据页 JOIN 数据集成工具 Web 接口 原子性 Entity 速度 服务器中毒 部署 工具链 排行榜 排序 Redka 网络 Pottery StarRocks 数据仓库 Testcloud 云端自动化 Caffeine CP 事务隔离 分布式架构 分布式锁​ 分页方案 排版 大表 业务场景 池化技术 连接池 悲观锁 乐观锁 主从复制 代理 dbt 数据转换工具 1 日志 优化器 单点故障 AIOPS LRU 分页 Order EasyExcel MySQL8 意向锁 记录锁 仪表盘 sqlmock 事务同步 数据字典 兼容性 InfluxDB 对象 ReadView UUIDv7 主键 Ansible UUID ID Crash 代码 订单 RAG HelixDB 单线程 IT 双引擎 字典 产业链 编程 LLM Valkey Valkey8.0 恢复数据 Weaviate 分布式锁 Zookeeper MGR 分布式集群 千万级 线程安全 Pump 关系数据库 List 类型 拦截器 动态代理 Next-Key 表空间 解锁 调优 慢SQL优化 快照读 当前读 视图 国产 用户 RR 互联网 GitHub Git 算法 神经系统 矢量存储 数据库类型 AI代理 查询规划 count(*) count(主键) 行数 技巧 CAS 并发控制 恢复机制 多线程 闪回