贝利信息

SQL 分库分表下分页如何实现?

日期:2026-01-26 00:00 / 作者:舞夢輝影
应使用全局唯一递增ID实现游标分页替代OFFSET:SELECT FROM order_001 WHERE id > 12345 ORDER BY id LIMIT 20;id需全局唯一有序(如雪花ID),禁用单独create_time;管理后台等特殊场景可多分片并行查+应用层归并,但须熔断;COUNT()应避免,改用近似值或异步汇总。

全局唯一递增 ID 代替 OFFSET

分库分表后 OFFSET 分页会跨多个物理分片扫描,导致性能断崖式下降,尤其在深分页(如 OFFSET 100000)时几乎不可用。根本原因是各分片数据分布不均、排序不一致,LIMIT OFFSET 无法保证逻辑顺序。

实际做法是放弃 OFFSET,改用「游标分页」:依赖某个严格单调递增且全局唯一的字段(如 idcreate_time + sharding_key 组合),每次查询带上上一页最后一条的值:

SELECT * FROM order_001 WHERE id > 12345 ORDER BY id LIMIT 20;

注意点:

多分片结果合并排序(慎用)

当必须支持随机页码(如管理后台导出第 50 页),且数据量可控(百万级以内),可走「各分片并行查 + 应用层归并」路径。但这是兜底方案,不是常规解法。

典型流程:

务必加熔断:若单次合并条数超阈值(如 5000),直接报错或降级为游标分页提示。

Count(*) 总数怎么算?

分库分表下 COUNT(*) 跨分片执行成本极高,多数场景应避免实时总数展示。

可行替代方案:

ShardingSphere 等中间件的分页行为

ShardingSphere 默认把 LIMIT 10 OFFSET 20 拆成 LIMIT 30 下发到每个分片,再内存归并取 20 条。这看似省事,实则放大了问题:每个分片都返回冗余数据,IO 和 CPU 双重浪费。

关键配置项:

别迷信中间件的“透明分页”能力 —— 它解决的是语法兼容,不是性能本质。真正的分页治理,得从 SQL 设计源头控制。

游标字段选什么、怎么索引、如何应对删除导致的空洞、分页缓存要不要做……这些细节一旦漏掉,线上就容易出现漏数据或重复数据。比写对 SQL 更难的,是让整个链路对“顺序”有共识。