OceanBase直播：AI时代数据库三大核心命题

作者：袖梨 2026-07-02

6月29日下午，我抽空看了OceanBase的直播，三个主题干货很满，和大家聊聊我的真实感受。

杨冰讲行业趋势，说AI时代数据库「为什么变」；

杨传辉讲技术架构，说OceanBase「凭什么能变」；

韩富晟讲产品落地，说「变了之后怎么用」。

第一个命题：AI到底改变了什么？

开场抛了个判断，AI已具备通用智能，但距离企业智能还有「一步」。

这「一步」是什么？不是模型不够聪明，是模型不懂你的业务——不懂你的数据语义，不懂你的流程上下文，不懂你的决策逻辑。而让模型懂业务，靠的不是堆参数，是你的数据底座能不能把业务语义「说清楚」。

第一层：谁在用数据？

到2028年，三分之一的企业软件将转向Agent。Agent不是「更聪明的用户」，是自动化数据消费者

——会自己查、自己算、自己决策、自己改数据。

这意味着什么？数据库的「前端」不再是人，而是代码。连接数、并发量、查询模式，全都会发生根本性变化。这一点已经是共识了，国内外的数据库都说以前是数据库面对人，以后是数据库面对Agent。

第二层：数据长什么样？

2025年全球数据总量预计175ZB，其中大部分是非结构化的——文档、图片、视频、音频。企业软件将在2030年前全面迈入多模态时代。

传统数据库擅长管结构化的表，但Agent天然需要消费多模态数据。结构化与非结构化信息必须同时构成业务上下文，一起被检索、一起被理解。

第三层：数据怎么流转？

Agent会执行生产任务——不只是查，还会写、会改、会试错。支付宝的资金风控Agent、淘宝的AI购物助理，都是真实的生产级场景。

生产级Agent需要三件事：高质量的多模上下文、毫秒级的检索响应、隔离的试错环境。传统数据库的「存算分离」和「事务隔离」能力，在新的语境下有了新的意义。

第二个命题：数据库凭什么能适应AI？

杨传辉老师主要讲OceanBase怎么从技术架构层面支撑AI时代的需求，核心是湖库一体

的设计理念。这是今天的一个新名词。

传统架构的痛点

传统架构里，「数据湖」和「数据仓库」是分开的——湖存原始数据，库做结构化分析，中间靠ETL搬运。这套架构在AI时代越来越吃力：

• 多模态数据在湖里，语义搜索在计算引擎里，上下文割裂；

• 数据搬运延迟高，一致性难保证；

• AI需要同时消费结构化和非结构化数据，但两套系统打通成本极高。

OceanBase的湖库一体设计

杨老师讲的是真正的融合，不是简单拼接，是从存储引擎到计算框架的统一设计：

1. 统一存储引擎：原生支持向量、文本、图像、结构化数据的统一存储，不用再在不同系统之间搬数据；

2. 统一计算框架：支持SQL、Python、Spark等多种计算引擎，不绑定单一技术栈；

3. 统一访问接口：给AI提供了原生的API和SDK，Agent可以直接调用，不需要自己写适配层；

4. 多模态混合搜索：向量搜索、关键词搜索、结构化查询可以融合在一起，一次召回完整的上下文。

最难得的一点：没丢基本功。杨老师特别提到，OceanBase的湖库一体是「生产级」的，不是实验室的demo——强一致性、高可用性、弹性扩展这些数据库的基本功，一个都没丢。

第三个命题：变了之后的数据库长什么样？

韩富晟讲的就是「怎么变」——前面说了要变、能变，现在说变了之后，用户拿到手的是什么。

他发布了三款新品，底层逻辑其实是一条线：数据库在AI时代必须同时做到三件事——存得下、算得动、用得好

Lakebase：湖库一体的落地产品

对应杨传辉老师讲的技术架构，Lakebase是具体的落地产品，核心是四个关键词：

• 多模态处理：原生支持向量、文本、图像、结构化数据的统一存储与处理；

• 多模混合搜索：向量搜索关键词搜索结构化查询融合，一次召回完整上下文；

• 开放计算：支持SQL、Python、Spark等多种计算引擎，不绑定单一技术栈；

• Agent友好：丰富的访问接口，让数据更容易被AI理解和调用。

总体来说，发布会告诉观众：OceanBase AI数据库，是以湖库一体为核心架构、面向Agent和多模态数据设计的现代数据基础设施。它将数据库的事务、一致性与实时处理能力，与数据湖的开放、海量存储和多样化计算能力统一起来，把结构化、半结构化、非结构化数据纳入统一管理体系，打通在线服务与离线分析，消除多系统拼装带来的数据割裂、链路冗余与工程复杂性，为现代AI应用提供可靠、实时、可扩展的数据底座。

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。原始发表：2026-06-30，如有侵权请联系[email protected] 删除