CentOS 下 HBase 数据迁移方案

一、方案总览与选型
二、标准操作步骤
离线 Snapshot 迁移(推荐)
Export/Import MapReduce
Replication 近实时迁移
Bulk Load 批量导入(高吞吐)
停服 DistCp 拷贝
三、方法对比与适用场景
| 方法 | 停机要求 | 速度与成本 | 一致性 | 适用场景 |
|---|---|---|---|---|
| Snapshot 克隆/拷贝 | 不停机 | 快(元数据级),网络/存储有开销 | 高(时间点一致) | 版本升级、跨环境迁移、快速克隆 |
| Export/Import | 不停机 | 中(MR 作业),可并行 | 高(导出时点一致) | 通用离线迁移、跨版本/跨发行版 |
| Replication | 不停机 | 近实时,带宽持续占用 | 最终一致 | 不停机迁移、双写到切换 |
| Bulk Load | 不停机 | 写入吞吐高,准备阶段有计算成本 | 高(导入时点一致) | 超大数据量、对写入性能敏感 |
| DistCp 停服 | 需停写 | 快(直拷),需停机窗口 | 高(停机时点一致) | 允许停机的全量迁移 |
四、迁移前后关键检查与注意事项