OceanBase直播:AI时代数据库三大核心命题

作者:袖梨 2026-07-02

6月29日下午,我抽空看了OceanBase的直播,三个主题干货很满,和大家聊聊我的真实感受。

OceanBase直播:AI时代数据库的三个核心命题

杨冰讲行业趋势,说AI时代数据库「为什么变」;

杨传辉讲技术架构,说OceanBase「凭什么能变」;

韩富晟讲产品落地,说「变了之后怎么用」。

第一个命题:AI到底改变了什么?

开场抛了个判断,AI已具备通用智能,但距离企业智能还有「一步」。

这「一步」是什么?不是模型不够聪明,是模型不懂你的业务——不懂你的数据语义,不懂你的流程上下文,不懂你的决策逻辑。而让模型懂业务,靠的不是堆参数,是你的数据底座能不能把业务语义「说清楚」。

第一层:谁在用数据?

到2028年,三分之一的企业软件将转向Agent。Agent不是「更聪明的用户」,是自动化数据消费者

——会自己查、自己算、自己决策、自己改数据。

这意味着什么?数据库的「前端」不再是人,而是代码。连接数、并发量、查询模式,全都会发生根本性变化。这一点已经是共识了,国内外的数据库都说以前是数据库面对人,以后是数据库面对Agent。

第二层:数据长什么样?

2025年全球数据总量预计175ZB,其中大部分是非结构化的——文档、图片、视频、音频。企业软件将在2030年前全面迈入多模态时代。

传统数据库擅长管结构化的表,但Agent天然需要消费多模态数据。结构化与非结构化信息必须同时构成业务上下文,一起被检索、一起被理解。

第三层:数据怎么流转?

Agent会执行生产任务——不只是查,还会写、会改、会试错。支付宝的资金风控Agent、淘宝的AI购物助理,都是真实的生产级场景。

生产级Agent需要三件事:高质量的多模上下文、毫秒级的检索响应、隔离的试错环境。传统数据库的「存算分离」和「事务隔离」能力,在新的语境下有了新的意义。

第二个命题:数据库凭什么能适应AI?

杨传辉老师主要讲OceanBase怎么从技术架构层面支撑AI时代的需求,核心是湖库一体

的设计理念。这是今天的一个新名词。

传统架构的痛点

传统架构里,「数据湖」和「数据仓库」是分开的——湖存原始数据,库做结构化分析,中间靠ETL搬运。这套架构在AI时代越来越吃力:

• 多模态数据在湖里,语义搜索在计算引擎里,上下文割裂;

• 数据搬运延迟高,一致性难保证;

• AI需要同时消费结构化和非结构化数据,但两套系统打通成本极高。

OceanBase的湖库一体设计

杨老师讲的是真正的融合,不是简单拼接,是从存储引擎到计算框架的统一设计:

1. 统一存储引擎:原生支持向量、文本、图像、结构化数据的统一存储,不用再在不同系统之间搬数据;

2. 统一计算框架:支持SQL、Python、Spark等多种计算引擎,不绑定单一技术栈;

3. 统一访问接口:给AI提供了原生的API和SDK,Agent可以直接调用,不需要自己写适配层;

4. 多模态混合搜索:向量搜索、关键词搜索、结构化查询可以融合在一起,一次召回完整的上下文。

最难得的一点:没丢基本功。杨老师特别提到,OceanBase的湖库一体是「生产级」的,不是实验室的demo——强一致性、高可用性、弹性扩展这些数据库的基本功,一个都没丢。

第三个命题:变了之后的数据库长什么样?

韩富晟讲的就是「怎么变」——前面说了要变、能变,现在说变了之后,用户拿到手的是什么。

他发布了三款新品,底层逻辑其实是一条线:数据库在AI时代必须同时做到三件事——存得下、算得动、用得好

Lakebase:湖库一体的落地产品

对应杨传辉老师讲的技术架构,Lakebase是具体的落地产品,核心是四个关键词:

• 多模态处理:原生支持向量、文本、图像、结构化数据的统一存储与处理;

• 多模混合搜索:向量搜索 关键词搜索 结构化查询融合,一次召回完整上下文;

• 开放计算:支持SQL、Python、Spark等多种计算引擎,不绑定单一技术栈;

• Agent友好:丰富的访问接口,让数据更容易被AI理解和调用。

总体来说,发布会告诉观众:OceanBase AI数据库,是以湖库一体为核心架构、面向Agent和多模态数据设计的现代数据基础设施。它将数据库的事务、一致性与实时处理能力,与数据湖的开放、海量存储和多样化计算能力统一起来,把结构化、半结构化、非结构化数据纳入统一管理体系,打通在线服务与离线分析,消除多系统拼装带来的数据割裂、链路冗余与工程复杂性,为现代AI应用提供可靠、实时、可扩展的数据底座。

本文参与腾讯云自媒体同步曝光计划,分享自微信公众号。原始发表:2026-06-30,如有侵权请联系[email protected] 删除

相关文章

精彩推荐