RAGFlow v0.26.2 重磅发布,全面增强聊天渠道与文件解析能力,为开发者带来更强大的AI应用构建体验。核心内容:1. 新增WhatsApp、钉钉、企业微信三大主流聊天渠道集成能力2. 文件解析链路增强,重点优化OCR与图像内容处理3. 数据集管理、MCP稳定性及Go生态工具链的持续演进
RAGFlow 发布了 v0.26.2 Latest,发布时间为 2026 年 6 月 29 日。
本次版本更新内容非常集中,既有面向业务使用的功能增强,也有面向底层能力的稳定性修复,还包含大量 Go API、Go CLI、数据集、文档解析、聊天渠道、MCP、Dataflow、模型接入、前端体验等方面的持续演进。
从官方变更内容来看,v0.26.2 的重点主要集中在以下几个方向:
Released on June 29, 2026.
也就是:RAGFlow v0.26.2 于 2026 年 6 月 29 日正式发布。
本次版本在“New features”部分给出的新增能力,主要包括聊天渠道接入和文件解析增强两大块。
RAGFlow v0.26.2 新增了 WhatsApp 集成能力,接入方式为:
这意味着在聊天渠道层面,RAGFlow 已经把 WhatsApp Web 类型的接入能力纳入支持范围。
新增 DingTalk(钉钉) 集成能力,接入方式为:
对于企业内部消息触达与机器人对接场景来说,这属于非常直接且实用的能力扩展。
新增 WeCom(企业微信) 集成能力,接入方式为:
这意味着 RAGFlow 在企业级沟通入口上的覆盖进一步增强。
在文件解析方面,本次版本新增了两项关键能力:
这说明 RAGFlow 在 OCR 识别兼容性和图像内容解析链路上都进行了增强。
“Improvements”部分的更新看似不多,但都非常关键,集中在数据集、聊天渠道和国际化三个领域。
新增了一个边界检查逻辑,用于在文件摄取时:
这能避免空目录在接入数据集时出现异常或处理失败。
对 get_flatted_meta_by_kbs() 方法增加了分页能力,以防止以下问题:
该改进明显是为大规模知识库场景提供稳定性保障。
对聊天渠道历史会话持久化逻辑进行了优化,具体表现为:
这解决了“历史能否持久化”和“新旧对话是否混淆”两个核心问题。
补充了以下法语翻译缺失项:
这一部分是本次版本最关键的内容之一,涉及文件解析、MCP、Dataflow、LLM、UI/UX 多个方向。
修复了如下问题:
.docx 文件时Heading 样式时会抛出 ValueError修复问题:
.docx 文件里的表格会被静默移除修复问题:
修复问题:
修复问题:
修复问题:
page_size 限制修复内容:
修复内容:
修复问题:
gemini-3.5-flash 模型时eu 或 us 区域 endpoint 会失败修复方式为:
aiplatform.修复问题:
下面按照官方完整变更记录,对所有更新逐条整理。为便于阅读,按主题归类呈现。
ALLOW_ANY_HOST,用于跳过 host 检查这是本次版本最显著的功能扩展之一。
ERROR: 'knowledge'这一部分内容非常多,也是 v0.26.2 的核心之一。
ocrResults 回退逻辑Heading 样式触发 ValueErroruse_sql 场景下 Markdown 分隔符与 Source header 对齐问题naive_merge 对超大 section 的拆分与 overlap token 统计逻辑[ID:0] 未转换为 Fig. 1 的问题document_service 中 progress_msg.strip() 可能出现的 NoneType 错误/v1/document/upload_info 到 /api/v1/documents/upload 的回补支持get_flatted_meta_by_kbs() 增加分页,支持超过 10k 文档的数据集 PATCH 接口 POST 接口/datasets/ DELETE/api/v1/datasets/ PUT/api/v1/datasets/ 的相关接口/chunks 文档存储清理时租户选择问题,改为使用数据集所有者租户normalizeDatasetID 进行修复list_datasets.sh 示例脚本NoneType 崩溃all_models.json 补充缺失的 qwen 模型本次版本有大量 Go API 迁移与补齐工作。
/api/v1/datasets/ PUT/api/v1/datasets/ 相关接口/api/v1/datasets/ POST PATCH/datasets//datasets/ DELETE/api/v1/datasets/{dataset_id}/documents/{document_id}/chunks POST POST/datasets/ DELETEconnectors/ 路由Go CLI 是本次版本中更新最密集的部分之一,功能新增、重构与修复非常多。
ragflow_cli 重命名为 ragflow-cliparseAddModel 中变量与标签命名Unknown Authors 的问题None 时字符串操作失败的问题contextvarsrag/raptor 中 GMM cluster selection 的 max_cluster 边界问题is_english 对字符串输入的处理,按单个短语处理progress_msg.strip() 的 NoneType 问题pdf_parser.py 迁移到 Golang为确保不遗漏官方提供的任何信息,下面按内容再次做一轮完整覆盖式归档:
get_flatted_meta_by_kbs() 增加分页,避免超过 10000 文档时 CRUD 失败Heading 样式触发 ValueError[ID:0] 未转换为 Fig. 1naive_merge 分割和 token overlap 统计pdf_parser.py 迁移到 Gopage_size 限制冲突导致的 MCP 连接与数据集发现失败ragflow-cliRAGFlow v0.26.2 是一个覆盖面非常广的版本,更新既包含面向终端接入的新增聊天渠道,也包含底层基础设施的大量修复与 Go 化推进。
从官方变更内容来看,这一版的价值主要体现在以下几类能力同时推进:
·
我们相信人工智能为普通人提供了一种“增强工具”,并致力于分享全方位的AI知识。在这里,您可以找到最新的AI科普文章、工具评测、提升效率的秘籍以及行业洞察。
登录查看剩余 70% 内容