MongoDB集群冷热数据分离实现_利用Tag-Aware Sharding将数据定向到不同性能磁盘

作者：袖梨 2026-06-30

Tag-Aware Sharding必须依赖分片集群，仅在副本集节点打标签对写入无效；冷热数据物理分离需配合sh.addShardTag()、sh.addTagRange()及开启balancer，且分片键须覆盖全量数据范围并确保chunk迁移完成。

Tag-Aware Sharding 必须配合分片集群，副本集打 tags 没用

副本集里给节点加 tags 只能影响读请求路由（readPreferenceTags），对写入完全无效。冷热数据真正物理分离，必须用分片集群 + tag-aware sharding。否则所谓“分离”只是读走冷节点、写仍打到主节点再同步——冷节点磁盘照样要承受复制流量，起不到降本或隔离效果。

关键判断点：
- 如果你只有副本集，别折腾 tags 控制写入，它不支持；
- 如果你已上分片集群，但没开 balancer 或没设 tag range，那 sh.addShardTag() 单独调用只是存了个元数据，数据不会自动迁移。

确认是否为分片集群：运行 sh.status()，输出中要有 shards 和 balancer 状态
冷热标签必须施加在 shard 上，不是 mongod 进程或副本集成员上
标签值只能是字符串，比如 "tier": "cold"，不能写 "tier": 0 或 "tier": false

sh.addTagRange() 的范围必须覆盖全生命周期数据，不能只标“过去”

常见错误是只给旧数据加 tag range，例如：sh.addTagRange("db.col", { createdAt: MinKey }, { createdAt: ISODate("2023-01-01") }, "cold")。这会导致新写入的数据（createdAt > 2023-01-01）落在默认 chunk 分配路径上，很可能集中到某一个 shard，打破冷热边界。

正确做法是用两段互斥 range 覆盖全部键空间：

sh.addTagRange("db.col", { createdAt: MinKey }, { createdAt: ISODate("2023-01-01") }, "cold")sh.addTagRange("db.col", { createdAt: ISODate("2023-01-01") }, { createdAt: MaxKey }, "hot")

注意：
- MinKey / MaxKey 是 MongoDB 内置常量，不是字符串；
- 两个 range 必须首尾相接，中间不留空隙，也不重叠；
- shard key 必须是 createdAt 或其前缀，否则 range 不生效。

chunk 迁移不会立刻发生，得等 balancer 触发 moveChunk

执行完 sh.addShardTag() 和 sh.addTagRange() 后，数据不会秒级挪到目标 shard。MongoDB 靠 balancer 周期性检查 chunk 分布，发现不合规时才触发 moveChunk。这意味着：

刚设完 tag range，sh.status() 里 chunk 仍显示在原 shard 上，属正常现象
如果 balancer 关闭（sh.setBalancerState(false)），迁移永远不发生
迁移过程会消耗网络和 I/O，大 chunk（默认 64MB）迁移期间可能影响查询延迟
可手动触发一次均衡：sh.startBalancer()（若已关）+ 等待几分钟，再查 sh.status()

验证是否生效，别只看配置，要看实际 chunk 分布：db.getSiblingDB("config").chunks.find({ "min.createdAt": { $lt: ISODate("2023-01-01") } }).count()，再比对该 count 是否与目标 cold shard 的 chunk 数一致。