6月29日下午,我抽空看了OceanBase的直播,三个主题干货很满,和大家聊聊我的真实感受。

杨冰讲行业趋势,说AI时代数据库「为什么变」;
杨传辉讲技术架构,说OceanBase「凭什么能变」;
韩富晟讲产品落地,说「变了之后怎么用」。
开场抛了个判断,AI已具备通用智能,但距离企业智能还有「一步」。
这「一步」是什么?不是模型不够聪明,是模型不懂你的业务——不懂你的数据语义,不懂你的流程上下文,不懂你的决策逻辑。而让模型懂业务,靠的不是堆参数,是你的数据底座能不能把业务语义「说清楚」。
到2028年,三分之一的企业软件将转向Agent。Agent不是「更聪明的用户」,是自动化数据消费者
——会自己查、自己算、自己决策、自己改数据。
这意味着什么?数据库的「前端」不再是人,而是代码。连接数、并发量、查询模式,全都会发生根本性变化。这一点已经是共识了,国内外的数据库都说以前是数据库面对人,以后是数据库面对Agent。
2025年全球数据总量预计175ZB,其中大部分是非结构化的——文档、图片、视频、音频。企业软件将在2030年前全面迈入多模态时代。
传统数据库擅长管结构化的表,但Agent天然需要消费多模态数据。结构化与非结构化信息必须同时构成业务上下文,一起被检索、一起被理解。
Agent会执行生产任务——不只是查,还会写、会改、会试错。支付宝的资金风控Agent、淘宝的AI购物助理,都是真实的生产级场景。
生产级Agent需要三件事:高质量的多模上下文、毫秒级的检索响应、隔离的试错环境。传统数据库的「存算分离」和「事务隔离」能力,在新的语境下有了新的意义。
杨传辉老师主要讲OceanBase怎么从技术架构层面支撑AI时代的需求,核心是湖库一体
的设计理念。这是今天的一个新名词。
传统架构里,「数据湖」和「数据仓库」是分开的——湖存原始数据,库做结构化分析,中间靠ETL搬运。这套架构在AI时代越来越吃力:
• 多模态数据在湖里,语义搜索在计算引擎里,上下文割裂;
• 数据搬运延迟高,一致性难保证;
• AI需要同时消费结构化和非结构化数据,但两套系统打通成本极高。
杨老师讲的是真正的融合,不是简单拼接,是从存储引擎到计算框架的统一设计:
1. 统一存储引擎:原生支持向量、文本、图像、结构化数据的统一存储,不用再在不同系统之间搬数据;
2. 统一计算框架:支持SQL、Python、Spark等多种计算引擎,不绑定单一技术栈;
3. 统一访问接口:给AI提供了原生的API和SDK,Agent可以直接调用,不需要自己写适配层;
4. 多模态混合搜索:向量搜索、关键词搜索、结构化查询可以融合在一起,一次召回完整的上下文。
最难得的一点:没丢基本功。杨老师特别提到,OceanBase的湖库一体是「生产级」的,不是实验室的demo——强一致性、高可用性、弹性扩展这些数据库的基本功,一个都没丢。
韩富晟讲的就是「怎么变」——前面说了要变、能变,现在说变了之后,用户拿到手的是什么。
他发布了三款新品,底层逻辑其实是一条线:数据库在AI时代必须同时做到三件事——存得下、算得动、用得好
对应杨传辉老师讲的技术架构,Lakebase是具体的落地产品,核心是四个关键词:
• 多模态处理:原生支持向量、文本、图像、结构化数据的统一存储与处理;
• 多模混合搜索:向量搜索 关键词搜索 结构化查询融合,一次召回完整上下文;
• 开放计算:支持SQL、Python、Spark等多种计算引擎,不绑定单一技术栈;
• Agent友好:丰富的访问接口,让数据更容易被AI理解和调用。
总体来说,发布会告诉观众:OceanBase AI数据库,是以湖库一体为核心架构、面向Agent和多模态数据设计的现代数据基础设施。它将数据库的事务、一致性与实时处理能力,与数据湖的开放、海量存储和多样化计算能力统一起来,把结构化、半结构化、非结构化数据纳入统一管理体系,打通在线服务与离线分析,消除多系统拼装带来的数据割裂、链路冗余与工程复杂性,为现代AI应用提供可靠、实时、可扩展的数据底座。
本文参与腾讯云自媒体同步曝光计划,分享自微信公众号。原始发表:2026-06-30,如有侵权请联系[email protected] 删除