本体论支撑的故障诊断系统构想

作者:袖梨 2026-07-05

HVAC-Diagnostic-Brain(HDB)是一款专为暖通空调领域打造的智能医生。

它主要应用于大型商业楼宇、工业厂房的空调系统维保场景。

它能听懂维修工口语化的报修描述,结合物理定律与 AI 推理,精准锁定制冷机组等复杂设备的故障根因。

并能自动规划长达10步以上的排查逻辑链,按概率排序给出最优维修方案,并强制校验安全红线,杜绝幻觉。

它让复杂的维修变得像跟着导航开车一样简单、专业且安全。

四层解耦架构

1. 数据层

在 Neo4j 中,知识不再以孤立的三元组存储,而以决策树路径存储。

节点扩展:- Symptom (现象):如“高压报警”。- CheckState (检测中间态):如“冷凝器压力值”。- Fault (故障根因):如“冷凝器结垢”。- Operation (维修动作):如“化学清洗”。关系增强(带属性的关系):- [FOLLOWED_BY {condition: ">2.5MPa", prob: 0.8}]:定义 10 步链条中的跳转逻辑与可能性。- [PREREQUISITE]:硬性约束。如,拆机前必须先断电。

2. 逻辑层

引入概率路径算法。

路径检索: 不使用向量相似度,而是使用 Cypher 的深度遍历算法。概率计算: 引入贝叶斯链条。若 A->B(0.8) 且 B->C(0.7),则整条路径 A->C 的置信度为 0.56。剪枝逻辑: 当用户反馈某个检查点为“正常”时,硬逻辑自动剔除所有基于“异常”分支的后续 10 步路径。

3. 智能体协作层

将现在知识图谱 RAG 中的四个智能体进行重构。

分诊专家 (Triage Agent): 负责将用户的模糊口语转化为图谱中的标准 Symptom。路径规划员 (Path Planner): 根据当前状态,从 Neo4j 提取前 3 条最可能的“10步诊断链”。交互引导员 (Interviewer Agent): 负责执行 10 步中的“中间询问”。如,“请观察室外机风机是否转动?”安全合规官 (Safety Guard): 负责用 SHACL 校验生成的维修方案是否包含必选的安全步骤。

4. 交互层

引入诊断会话机制。系统记录用户已经做到了第几步,当前处于路径的哪个分支。

数据流图

HVAC-Diagnostic-Brain 是一个受约束的、带记忆的、可自我进化的逻辑推演引擎。

1. 分诊对齐 (P1)

输入: 维修工口语。如“机子喘得厉害”。处理: 软本体 Agent 利用语义理解将其对齐为图谱中的标准节点 Symptom: Surging。

2. 路径挖掘 (P2)

逻辑: 这是一个深度优先遍历过程。它从 Symptom 出发,在 Neo4j 中寻找长度最高可达 10-15 跳的 LEADS_TO 路径,直到终点 Action。

3. 推理与剪枝 (P3)

核心逻辑:

概率计算: 沿着 10 步路径累乘概率,算出置信度最高的 Top-N 路径。硬逻辑剪枝: 如果路径 A 假设“压力高”,但外部传感数据或用户反馈显示“压力正常”,则 P3 直接剔除该路径(剪枝),防止无效引导。

4. 交互反馈循环

这是一个状态机循环。系统每推送 1-2 个检查步骤,都会要求用户反馈结果(DS3 会话状态)。数据流向: 用户反馈回传给 P1,触发 P3 重新计算路径置信度,实现动态导引。

5. 安全围栏 (P4)

这是混合本体的刚性体现。在方案离开系统前,SHACL 引擎强制检查是否包含特定的安全动作,不合规即拦截并报错。

6. 学习进化

绿色数据流: 当维修完成后,人员反馈“按此方案修好了”,数据流向 DS1 知识图谱,自动调高该路径上相关边的 probability 权重值。

执行流程场景模拟

0. 初始输入: “中央空调主机运行 10 分钟后自动停机,显示屏闪烁,没有报错代码。”

1. 理解与对齐 (Step 1-2):

Agent A 识别现象:Unexpected_Shutdown No_Error_Code。检索图谱发现 3 条长路径,概率最高的一条涉及 12 个步骤。

2. 交互式诊断 (Step 3-6):

系统不会直接给方案,而是开始引导。“第 3 步:请触摸压缩机外壳,是否烫手?” -> 用户回答:“非常烫。”概率更新: 路径“过载保护”概率从 0.4 升至 0.9,“电路板故障”概率降至 0.05(逻辑剪枝)。

3. 深度下钻 (Step 7-9):

系统引导:“第 7 步:请测量启动电容的电容量。” -> 用户反馈数值。硬逻辑校验:该数值低于标准限值 20%,符合故障定义。

4. 方案输出 (Step 10 ):

系统生成最终方案:“更换启动电容”。SHACL 强制介入: 方案末尾自动添加:“注意:更换前请确保放电,防止电击”。

五大核心技术难点

HVAC-Diagnostic-Brain 最难的环节在于知识的结构化治理。

把 1000 本 PDF 变成 1000 万个三元组很容易,但把它们变成一条条互不冲突、逻辑连贯、可计算概率的维修链,需要极强的本体设计能力。

1. 逻辑链的语义漂移与误差累积

难点描述:在 10 步的推理中,如果每一步的语义对齐准确率是 90%,那么到第 10 步时,整体准确率会衰减到 35%。技术瓶颈:LLM 在处理长链条时容易受到中间步骤幻觉的干扰。解决难度:⭐⭐⭐⭐⭐解决方案:必须引入逻辑剪枝(Logic Pruning)。每一步的输出必须经过硬本体的约束校验,一旦发现不符合物理定律,如低压保护时却要求检查高压开关,立即强制截断并重算,而不是让 LLM 继续往下猜。

2. 知识建模:从非标文本到逻辑有向无环图 (DAG)

难点描述:厂家手册、FMEA 表格和维修日志的格式极其不统一。手册里写的是“若 A 发生则检查 B”,但实际操作中可能包含隐含的前置条件。技术瓶颈:如何自动从非结构化文本中提取出带有 “If-Then-Else” 逻辑的图结构,而不仅仅是简单的“A 属于 B”关系。解决难度:⭐⭐⭐⭐解决方案:需要本体审计智能体。通过 Radical Agent 提取初稿,再由专门负责逻辑对齐的智能体对照《暖通标准术语库》进行实体消歧,确保“冷媒不足”和“氟利昂不够”在图谱中被强制归并为一个逻辑节点。

3. 动态概率权重的获取与冷启动

难点描述:维修方案中的概率往往没有现成数据,手册里通常只给出列表,不给概率。技术瓶颈:初始概率从哪儿来?如何随实际维修结果动态更新?解决难度:⭐⭐⭐⭐解决方案:- 冷启动阶段:利用 LLM 的先验知识给出初始概率排名。- 运行阶段:引入强化学习反馈(RLHF 的变体)。维修人员反馈“修好了”或“没修好”,系统自动利用贝叶斯公式更新边上的权重。

4. 长时记忆管理

难点描述:10 步维修可能跨越数小时甚至数天,如等待零件。传统的 LLM 对话窗口无法稳固地维持这种深度诊断状态。技术瓶颈:当用户在第 8 步突然说“等等,我刚才看错了,第 3 步那个压力表其实是红区”,系统如何实现逻辑回溯?解决难度:⭐⭐⭐⭐解决方案:外部状态机管理。不要把诊断过程存在 LLM 的记忆里,而是存在 Neo4j 的 Session 节点或 md 文件中。LLM 只作为处理器,每一轮对话都从数据库读取当前的诊断快照和已排除路径。

5. 符号推理与神经推理的时序对齐

难点描述:硬本体的符号推理是刚性的,LLM 的神经推理是柔性的。技术瓶颈:当 LLM 认为“根据经验,可能是电路板潮湿”,但硬本体查询显示“该机组安装在干燥机房,湿度传感器显示正常”时,系统如何仲裁冲突?解决难度:⭐⭐⭐⭐解决方案:权重仲裁机制。设定“硬规则”具有最高优先级的“一票否决权”。在 HDB 架构中,安全合规 Agent(Safety Guard)使用 SHACL 形状约束,拥有比分诊专家 Agent 更高的权限,任何违反物理约束的建议将被系统自动拦截并打回重审。

神经符号架构

我们将软本体和硬本体融合成神经符号架构。

负责语义理解的软本体是神经部分,记录在md文件中,决定了系统知识面的广度和对人类语言理解的灵活性。

负责逻辑推理的硬本体是符号部分,由程序实现,决定了系统专业性的下限和在审图、维修等严肃场景中的安全性。

软本体

本质: 一份用自然语言编写的领域规则和行动指南。载体: Global_HVACR_Ontology_Policy.md交互对象: 大语言模型(LLM / Agents)核心功能:- 语义对齐:告诉 AI 如何将口语对应到标准术语。- 知识抽取指引:规定哪些实体和关系是合法的。- 上下文理解:引导 AI 结合文档的前后文、注释、表格,进行有根据的推断。- 模糊处理:处理语言的多样性,比如将不同写法的单位统一初步规范化。特点: 灵活、有弹性、容错率高、易于编写和修改。

硬本体

本质: 一套用数学和代码编写的物理定律和检验脚本。载体: Python 脚本(owlready2)、OWL 文件、Neo4j 约束(n10s / SHACL)。交互对象: 知识图谱数据库、自动化校验流程。核心功能:- 逻辑死锁(互斥): 强制规定某些状态不能共存。如:制冷模式与加热模式互斥。- 数值熔断: 强制校验物理极值。如:温度超过 1000℃ 自动拦截。- 结构校验(SHACL): 确保三元组完整。如:设备必须有参数,参数必须有值,缺一不可。- 自动推理: 基于逻辑链自动派生新知识。如:A包含B,B包含C,则自动推理出 A包含C。特点: 绝对严谨、零容错、数学可证明、执行效率极高。

双重过滤机制

1. 语义转化阶段:软本体

动作: LLM 带着 md 规范阅读手册。分工: LLM 负责把“风管厚度不少于1.2mm”这句话,按照 md 里的格式要求,转化为初版 JSON 数据。此时 md 保证了语义的正确性。

2. 逻辑审判阶段:硬本体

动作: 结构化 JSON 进入 Python 校验脚本。分工: 程序根据硬本体定义的 OWL/SHACL 规则进行检查。逻辑检查: 如果 AI 抽取的风管材料是“彩钢板”,但耐火极限给了“10h”,硬程序立刻报警,因为超过物理极限。结构检查: 如果 AI 漏掉了来源条款,硬程序拦截。

3. 闭环修正阶段

动作: 如果硬本体校验失败,反馈给软本体。分工:- 硬程序: 给出具体的报错原因,“数值超标”。- 软本体 (AI): 收到报错,重新去 md 规范和原始文档里找原因,修正输出。- 最终结果: 只有通过了软理解且符合硬逻辑的数据,才被允许存入 Neo4j 知识图谱。本文参与腾讯云自媒体同步曝光计划,分享自微信公众号。原始发表:2026-03-16,如有侵权请联系[email protected] 删除

相关文章

精彩推荐