用存储过程做增量同步不可行,因其无状态、不感知binlog、无法捕获DELETE/UPDATE旧值、不保证事务一致性,仅适用于低频小规模非关键场景;必须依赖时间戳或自增ID字段(如TIMESTAMP ON UPDATE CURRENT_TIMESTAMP或BIGINT主键)作为增量标识,并通过IFNULL/COALESCE处理空值、严格使用>比较、手动维护sync_status表来规避重复与漏同步问题。直接说结论:用存储过程做增量同步可行,但只适合低频、小规模、非关键链路的场景;它没法捕获
DELETE 或 UPDATE 的旧值,也不感知 binlog,更无法保证事务一致性——别把它当主备同步方案用。存储过程本身没有“上次同步点”的记忆能力,只能靠查目标表已有的最大值来推断。如果源表没维护 created_at 或 updated_at 字段,SELECT ... WHERE 就无从下手。
TIMESTAMP(带 ON UPDATE CURRENT_TIMESTAMP)或 BIGINT 自增 ID(需确保插入顺序与业务逻辑一致)DATETIME 配合 NOW() —— 时区不一致时容易漏数据ALTER TABLE ... ADD COLUMN 并批量补值,否则历史数据永远不同步INSERT ... SELECT 语句里最容易漏掉的边界条件看似一行 SQL 能搞定,实际常因边界值出错。比如目标表为空时,MAX(sync_time) 返回 NULL,导致整个 WHERE 条件为假,新数据进不去。
IFNULL(MAX(sync_time), '1970-01-01 00:00:00') 或 COALESCE 处理空值>),不能用大于等于(>=),否则重复插入ON DUPLICATE KEY UPDATE 需求,存储过程里得改用 INSERT ... ON DUPLICATE KEY UPDATE,但要注意主键/唯一索引必须存在且定义清晰MySQL 存储过程不自动记录执行状态,每次 CALL IncrementalSync() 都是无状态重试。这意味着:
INSERT ... SELECT 是原子操作,但失败后得人工清理脏数据sync_status 表存 last_sync_time 和 executed_at,并在存储过程开头显式 UPDATE 它真要落地增量同步,优先看这些:
binlog_format = ROW,用 mysql-binlog-connector-java 或 canal 解析变更 —— 能捕获 INSERT/UPDATE/DELETE 全类型,且精准到行pt-online-schema-change 配合触发器写日志表 —— 适合不能改应用、又需要变更捕获的老系统存储过程适合临时救急或测试环境模拟同步流,但上线系统里把它当主力方案,迟早踩坑在数据不一致上。