本体论支撑的故障诊断系统构想

作者：袖梨 2026-07-05

HVAC-Diagnostic-Brain（HDB）是一款专为暖通空调领域打造的智能医生。

它主要应用于大型商业楼宇、工业厂房的空调系统维保场景。

它能听懂维修工口语化的报修描述，结合物理定律与 AI 推理，精准锁定制冷机组等复杂设备的故障根因。

并能自动规划长达10步以上的排查逻辑链，按概率排序给出最优维修方案，并强制校验安全红线，杜绝幻觉。

它让复杂的维修变得像跟着导航开车一样简单、专业且安全。

四层解耦架构

1. 数据层

在 Neo4j 中，知识不再以孤立的三元组存储，而以决策树路径存储。

节点扩展：- Symptom (现象)：如“高压报警”。- CheckState (检测中间态)：如“冷凝器压力值”。- Fault (故障根因)：如“冷凝器结垢”。- Operation (维修动作)：如“化学清洗”。关系增强（带属性的关系）：- [FOLLOWED_BY {condition: ">2.5MPa", prob: 0.8}]：定义 10 步链条中的跳转逻辑与可能性。- [PREREQUISITE]：硬性约束。如，拆机前必须先断电。

2. 逻辑层

引入概率路径算法。

路径检索：不使用向量相似度，而是使用 Cypher 的深度遍历算法。概率计算：引入贝叶斯链条。若 A->B(0.8) 且 B->C(0.7)，则整条路径 A->C 的置信度为 0.56。剪枝逻辑：当用户反馈某个检查点为“正常”时，硬逻辑自动剔除所有基于“异常”分支的后续 10 步路径。

3. 智能体协作层

将现在知识图谱 RAG 中的四个智能体进行重构。

分诊专家 (Triage Agent)：负责将用户的模糊口语转化为图谱中的标准 Symptom。路径规划员 (Path Planner)：根据当前状态，从 Neo4j 提取前 3 条最可能的“10步诊断链”。交互引导员 (Interviewer Agent)：负责执行 10 步中的“中间询问”。如，“请观察室外机风机是否转动？”安全合规官 (Safety Guard)：负责用 SHACL 校验生成的维修方案是否包含必选的安全步骤。

4. 交互层

引入诊断会话机制。系统记录用户已经做到了第几步，当前处于路径的哪个分支。

数据流图

HVAC-Diagnostic-Brain 是一个受约束的、带记忆的、可自我进化的逻辑推演引擎。

1. 分诊对齐 (P1)

输入：维修工口语。如“机子喘得厉害”。处理：软本体 Agent 利用语义理解将其对齐为图谱中的标准节点 Symptom: Surging。

2. 路径挖掘 (P2)

逻辑：这是一个深度优先遍历过程。它从 Symptom 出发，在 Neo4j 中寻找长度最高可达 10-15 跳的 LEADS_TO 路径，直到终点 Action。

3. 推理与剪枝 (P3)

核心逻辑：

概率计算：沿着 10 步路径累乘概率，算出置信度最高的 Top-N 路径。硬逻辑剪枝：如果路径 A 假设“压力高”，但外部传感数据或用户反馈显示“压力正常”，则 P3 直接剔除该路径（剪枝），防止无效引导。

4. 交互反馈循环

这是一个状态机循环。系统每推送 1-2 个检查步骤，都会要求用户反馈结果（DS3 会话状态）。数据流向：用户反馈回传给 P1，触发 P3 重新计算路径置信度，实现动态导引。

5. 安全围栏 (P4)

这是混合本体的刚性体现。在方案离开系统前，SHACL 引擎强制检查是否包含特定的安全动作，不合规即拦截并报错。

6. 学习进化

绿色数据流：当维修完成后，人员反馈“按此方案修好了”，数据流向 DS1 知识图谱，自动调高该路径上相关边的 probability 权重值。

执行流程场景模拟

0. 初始输入： “中央空调主机运行 10 分钟后自动停机，显示屏闪烁，没有报错代码。”

1. 理解与对齐 (Step 1-2)：

Agent A 识别现象：Unexpected_Shutdown No_Error_Code。检索图谱发现 3 条长路径，概率最高的一条涉及 12 个步骤。

2. 交互式诊断 (Step 3-6)：

系统不会直接给方案，而是开始引导。“第 3 步：请触摸压缩机外壳，是否烫手？” -> 用户回答：“非常烫。”概率更新：路径“过载保护”概率从 0.4 升至 0.9，“电路板故障”概率降至 0.05（逻辑剪枝）。

3. 深度下钻 (Step 7-9)：

系统引导：“第 7 步：请测量启动电容的电容量。” -> 用户反馈数值。硬逻辑校验：该数值低于标准限值 20%，符合故障定义。

4. 方案输出 (Step 10 )：

系统生成最终方案：“更换启动电容”。SHACL 强制介入：方案末尾自动添加：“注意：更换前请确保放电，防止电击”。

五大核心技术难点

HVAC-Diagnostic-Brain 最难的环节在于知识的结构化治理。

把 1000 本 PDF 变成 1000 万个三元组很容易，但把它们变成一条条互不冲突、逻辑连贯、可计算概率的维修链，需要极强的本体设计能力。

1. 逻辑链的语义漂移与误差累积

难点描述：在 10 步的推理中，如果每一步的语义对齐准确率是 90%，那么到第 10 步时，整体准确率会衰减到 35%。技术瓶颈：LLM 在处理长链条时容易受到中间步骤幻觉的干扰。解决难度：⭐⭐⭐⭐⭐解决方案：必须引入逻辑剪枝（Logic Pruning）。每一步的输出必须经过硬本体的约束校验，一旦发现不符合物理定律，如低压保护时却要求检查高压开关，立即强制截断并重算，而不是让 LLM 继续往下猜。

2. 知识建模：从非标文本到逻辑有向无环图 (DAG)

难点描述：厂家手册、FMEA 表格和维修日志的格式极其不统一。手册里写的是“若 A 发生则检查 B”，但实际操作中可能包含隐含的前置条件。技术瓶颈：如何自动从非结构化文本中提取出带有 “If-Then-Else” 逻辑的图结构，而不仅仅是简单的“A 属于 B”关系。解决难度：⭐⭐⭐⭐解决方案：需要本体审计智能体。通过 Radical Agent 提取初稿，再由专门负责逻辑对齐的智能体对照《暖通标准术语库》进行实体消歧，确保“冷媒不足”和“氟利昂不够”在图谱中被强制归并为一个逻辑节点。

3. 动态概率权重的获取与冷启动

难点描述：维修方案中的概率往往没有现成数据，手册里通常只给出列表，不给概率。技术瓶颈：初始概率从哪儿来？如何随实际维修结果动态更新？解决难度：⭐⭐⭐⭐解决方案：- 冷启动阶段：利用 LLM 的先验知识给出初始概率排名。- 运行阶段：引入强化学习反馈（RLHF 的变体）。维修人员反馈“修好了”或“没修好”，系统自动利用贝叶斯公式更新边上的权重。

4. 长时记忆管理

难点描述：10 步维修可能跨越数小时甚至数天，如等待零件。传统的 LLM 对话窗口无法稳固地维持这种深度诊断状态。技术瓶颈：当用户在第 8 步突然说“等等，我刚才看错了，第 3 步那个压力表其实是红区”，系统如何实现逻辑回溯？解决难度：⭐⭐⭐⭐解决方案：外部状态机管理。不要把诊断过程存在 LLM 的记忆里，而是存在 Neo4j 的 Session 节点或 md 文件中。LLM 只作为处理器，每一轮对话都从数据库读取当前的诊断快照和已排除路径。

5. 符号推理与神经推理的时序对齐

难点描述：硬本体的符号推理是刚性的，LLM 的神经推理是柔性的。技术瓶颈：当 LLM 认为“根据经验，可能是电路板潮湿”，但硬本体查询显示“该机组安装在干燥机房，湿度传感器显示正常”时，系统如何仲裁冲突？解决难度：⭐⭐⭐⭐解决方案：权重仲裁机制。设定“硬规则”具有最高优先级的“一票否决权”。在 HDB 架构中，安全合规 Agent（Safety Guard）使用 SHACL 形状约束，拥有比分诊专家 Agent 更高的权限，任何违反物理约束的建议将被系统自动拦截并打回重审。

神经符号架构

我们将软本体和硬本体融合成神经符号架构。

负责语义理解的软本体是神经部分，记录在md文件中，决定了系统知识面的广度和对人类语言理解的灵活性。

负责逻辑推理的硬本体是符号部分，由程序实现，决定了系统专业性的下限和在审图、维修等严肃场景中的安全性。

软本体

本质：一份用自然语言编写的领域规则和行动指南。载体： Global_HVACR_Ontology_Policy.md交互对象：大语言模型（LLM / Agents）核心功能：- 语义对齐：告诉 AI 如何将口语对应到标准术语。- 知识抽取指引：规定哪些实体和关系是合法的。- 上下文理解：引导 AI 结合文档的前后文、注释、表格，进行有根据的推断。- 模糊处理：处理语言的多样性，比如将不同写法的单位统一初步规范化。特点：灵活、有弹性、容错率高、易于编写和修改。

硬本体

本质：一套用数学和代码编写的物理定律和检验脚本。载体： Python 脚本（owlready2）、OWL 文件、Neo4j 约束（n10s / SHACL）。交互对象：知识图谱数据库、自动化校验流程。核心功能：- 逻辑死锁（互斥）：强制规定某些状态不能共存。如：制冷模式与加热模式互斥。- 数值熔断：强制校验物理极值。如：温度超过 1000℃ 自动拦截。- 结构校验（SHACL）：确保三元组完整。如：设备必须有参数，参数必须有值，缺一不可。- 自动推理：基于逻辑链自动派生新知识。如：A包含B，B包含C，则自动推理出 A包含C。特点：绝对严谨、零容错、数学可证明、执行效率极高。

双重过滤机制

1. 语义转化阶段：软本体

动作： LLM 带着 md 规范阅读手册。分工： LLM 负责把“风管厚度不少于1.2mm”这句话，按照 md 里的格式要求，转化为初版 JSON 数据。此时 md 保证了语义的正确性。

2. 逻辑审判阶段：硬本体

动作：结构化 JSON 进入 Python 校验脚本。分工：程序根据硬本体定义的 OWL/SHACL 规则进行检查。逻辑检查：如果 AI 抽取的风管材料是“彩钢板”，但耐火极限给了“10h”，硬程序立刻报警，因为超过物理极限。结构检查：如果 AI 漏掉了来源条款，硬程序拦截。

3. 闭环修正阶段

动作：如果硬本体校验失败，反馈给软本体。分工：- 硬程序：给出具体的报错原因，“数值超标”。- 软本体 (AI)：收到报错，重新去 md 规范和原始文档里找原因，修正输出。- 最终结果：只有通过了软理解且符合硬逻辑的数据，才被允许存入 Neo4j 知识图谱。本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。原始发表：2026-03-16，如有侵权请联系[email protected] 删除

本体论支撑的故障诊断系统构想

相关文章

精彩推荐