RMAN报“archived log not found”根本原因是控制文件未记录磁盘上存在的归档日志,常见于手动删除归档后未同步元数据、归档路径变更未重新catalog、RAC实例未全部mounted导致跨线程归档不可见,或recover until time/scn因按[FIRST_TIME, NEXT_TIME)区间判断而停在错误位置。
这是rman在recover阶段发现归档日志链断裂或未覆盖目标scn的明确信号,不是误报,而是恢复无法继续的准确判断。
常见错误现象是执行 RECOVER DATABASE 时提示 archived log not found,而你确认 /u01/arch/ 下确实存在对应 sequence# 的归档文件(如 1_100_1234567890.dbf)。根本原因不是文件丢失,而是控制文件没记录它。
CROSSCHECK ARCHIVELOG ALL,导致 RMAN 仍认为这些文件已过期(EXPIRED),直接跳过读取/u01/arch 改为 /u02/arch),但旧归档未用 CATALOG START WITH 重新注册.gz 压缩格式,RMAN 默认忽略,必须先 gunzip 解压再 catalog
BACKUP ARCHIVELOG ALL DELETE INPUT,但后续又手工清过目录,控制文件元数据与磁盘状态彻底脱节执行 RECOVER DATABASE UNTIL TIME '2026-06-05 14:22:00' 后 RMAN 返回 SUCCESS,但紧接着 ALTER DATABASE OPEN RESETLOGS 就报 ORA-01194 —— 这说明恢复停在了错误位置。
FIRST_TIME 判断是否覆盖目标时间,实际应用的是整个日志覆盖区间 [FIRST_TIME, NEXT_TIME)。若最后一个归档的 NEXT_TIME 是 14:22:03,它就会被全量应用,停在 14:22:03 而非你指定的 14:22:00
UNTIL SCN 同理:RMAN 只检查归档日志头中的 FIRST_CHANGE# 和 NEXT_CHANGE#,不精确截断到某个事务内RECOVER DATABASE UNTIL CANCEL,然后手动输入 AUTO 让 Oracle 自动选日志,直到提示 Media recovery complete 或 Specify log 时再中断在两节点 RAC 中执行 LIST ARCHIVELOG ALL,只看到 THREAD# = 1 的归档,THREAD# = 2 完全为空,即使共享存储中 +FRA/orcl/archivelog/2026_06_05/ 下有 node2 生成的归档文件。
V$ARCHIVED_LOG 视图默认只聚合当前实例的归档元数据,不自动跨实例同步MOUNTED 状态(不能只启一个节点),再进 RMAN 执行 RESYNC TARGET DATABASE
rman target sys/password@orcl),不能连单实例专用 TNS(如 orcl1)SELECT DISTINCT THREAD# FROM V$ARCHIVED_LOG 应返回 1 和 2;若只有一行,说明另一实例未参与广播或 CLUSTER_DATABASE=FALSE 被误设当 db_recovery_file_dest_size 达到 99% 以上,ORA-19815 和 ORA-16014 出现,数据库无法生成新归档,老归档也无法被 RMAN 删除 —— 形成死锁。
rm -f /u01/fast_recovery_area/*)完全无效,V$FLASH_RECOVERY_AREA_USAGE 仍显示 100% 使用率CROSSCHECK ARCHIVELOG ALL → DELETE NOPROMPT EXPIRED ARCHIVELOG ALL → DELETE NOPROMPT ARCHIVELOG ALL COMPLETED BEFORE 'SYSDATE-7'
control_file_record_keep_time(默认约30天),控制文件里无记录,RMAN 无法识别,只能手工删,且绝对安全——它们对当前恢复无任何作用ALTER SYSTEM SET db_recovery_file_dest_size = 20G SCOPE=BOTH,无需重启最常被忽略的点是:RMAN 从不还原在线 redo 日志,也从不依赖它们做介质恢复。所谓“需要更多归档”,本质是归档日志链在某个 SCN 断开,而这个断点可能藏在控制文件元数据缺失、RAC 实例未同步、或时间点计算逻辑里,而不是磁盘上少了一个文件。