MySQL崩溃恢复依赖redo log而非binlog,因redo log是物理日志、强制刷盘、精准记录页级变更,而binlog是逻辑日志、不保证持久性;undo log存于ibdata1或独立表空间,支撑MVCC与回滚;崩溃恢复分Redo Phase(前滚)和Undo Phase(回滚),顺序不可逆。
MySQL 崩溃后能恢复到最近一次提交的状态,靠的不是 binlog,而是 redo log。因为 binlog 是逻辑日志、追加写、不保证刷盘时机,且只记录“执行了什么 SQL”,无法精确还原页级变更;而 redo log 是物理日志、循环写、强制刷盘(受 innodb_flush_log_at_trx_commit 控制),记录的是“某个数据页的某个偏移位置改成了什么值”,可精准重放。
常见错误现象:把 innodb_flush_log_at_trx_commit=0 用于生产,机器掉电后大量事务丢失——这不是 bug,是配置明确放弃 redo log 持久性保障的结果。
innodb_flush_log_at_trx_commit=1:每次事务提交都 fsync 到磁盘,最安全,性能开销最大=2:写入 OS 缓存即返回,每秒 fsync 一次,断电可能丢 1 秒数据=0:只写内存,依赖后台线程刷盘,崩溃可能丢大量事务undo log 不是独立文件,而是存在 ibdata1(或独立表空间)里的段(UNDO LOG SEGMENT),由 ROLLBACK SEGMENT 管理。它记录事务修改前的数据镜像,既用于事务回滚,也供其他事务做一致性读(READ COMMITTED / REPEATABLE READ 隔离级别下构造快照)。
容易踩的坑:long running transaction 会阻塞 undo log 的清理(purge 线程无法回收其占用的空间),导致 ibdata1 持续膨胀,甚至触发 ERROR 1114 (HY000): The table is full。
innod
b_max_purge_lag 可控 purge 延迟,但治标不治本,需先定位长事务SELECT * FROM information_schema.INNODB_TRX WHERE TIME_TO_SEC(TIMEDIFF(NOW(), TRX_STARTED)) > 60 查找运行超 60 秒的事务undo tablespace 支持独立文件(MySQL 5.6+ 可配 innodb_undo_tablespaces),便于监控和清理MySQL 启动时自动执行崩溃恢复(crash recovery),分两阶段:
1. Redo Phase:按redo log重放所有已提交但未刷盘的页变更(前滚,Roll Forward) 2. Undo Phase:扫描undo log,对未提交事务执行回滚(回滚段中标记为 ACTIVE 的事务)
关键点在于:恢复顺序不可逆——必须先重放再回滚。否则未提交事务的中间状态会被固化,破坏原子性。
典型问题:如果 redo log 文件损坏(如磁盘坏道导致部分 ib_logfile0 读取失败),MySQL 启动直接报错 InnoDB: Error: log file ib_logfile0 is corrupted,无法继续恢复;此时只能从备份 + binlog 补日志,或启用 innodb_force_recovery(风险极高,仅限导出数据)。
不要等崩溃才查日志,日常应关注几个核心指标:
redo log 写入压力:SHOW GLOBAL STATUS LIKE 'Innodb_os_log_written'; 对比历史值,突增说明写负载高或刷盘慢undo 空间使用:SELECT TABLESPACE_NAME, FILE_SIZE, ALLOCATED_SIZE FROM INFORMATION_SCHEMA.FILES WHERE FILE_TYPE = 'UNDO LOG';
SELECT * FROM information_schema.INNODB_ROLLBACK_SEGMENTS WHERE STATE = 'ACTIVE';
SHOW ENGINE INNODB STATUS\G 中的 Log sequence number 和 Last checkpoint at 差值过大(如 > 1GB)说明刷盘滞后真正麻烦的从来不是日志本身,而是日志背后暴露的事务模型缺陷——比如一个更新语句没加索引导致全表扫描锁住整张表,进而拖垮整个 undo 清理链路。这时候调日志参数只是掩耳盗铃。