地球科学基础模型:从感知推理到科学发现
梯度主导项揭示Transformer学习词元关联的机制
Loopholing新机制确定性绕过离散扩散模型采样墙
Zatom-1:统一生成与预测的跨领域3D分子材料基础模型
利用层间几何结构聚合LLM中间层提升最终表示
三十个Token用户提示即可让十二款大模型赞助推荐失效
Groq与英伟达达成推理技术许可,加速全球AI推理部署
Databricks推出KARL企业知识代理,采用自定义RL加速
Suno v5.5发布:带来声音克隆、自定义模型与个性化推荐
硬约束扩散模型采样新方法:预测-投影-再噪声化
BlitzGS分布式框架用索引奇偶分片加速城市级高斯泼溅重建
Realtime-VLA FLASH:推测推理框架加速扩散式VLA实时部署
Databricks发布基于自定义RL的企业知识代理KARL
Anthropic 瞄准小企业主,AI 平台战事下沉至 3600 万商户
国产GPU联手SGLang等核心开发者,组建开源生态联盟
Runway AI 发布多模态视频模拟器及创意代理 Agent
Mistral AI 发布 Mistral Medium 3.5 模型及远程编码 Agent
Waymo CEO谈L2升维L4:云端基模蒸馏+语言对齐是关键
Suno v5.5上线:声音定制与My Taste个性化模型
Google在Gboard集成Gemini听写功能,率先落地三星Pixel
xAI与Anthropic达成计算合作,Grok推出深度集成与质量API
Waymo CEO谈L2升L4:云端基模蒸馏与语言对齐是关键
Replit发布Agent 4:最快最全能,赋能创意编程与生产应用
秒哒3.0让8岁小学生想法秒变手机APP,AI应用门槛归零
Ardent 推出秒级 Postgres 沙箱,零迁移供 AI 编码 agent 测试
CrewAI 1.14.5 废弃CrewAgentExecutor,新增状态恢复与搜索增强
ReBel:基于信念一致性奖励的长程智能体信用分配方法
Gemini Omni Reddit讨论 vs 官方测评:哪个更真实?
DecisionBench:面向长期代理工作流的多模型委托基准发布
Ardent 零迁移 Postgres 沙箱,秒级创建供 AI 编码代理测试
Google Gboard 集成 Gemini 听写,首登三星与 Pixel 手机
Anthropic 向下拓展市场,小企业主成AI平台新战场
Nvidia发布Nemotron扩散视觉语言模型8B
OScaR提出用奥卡姆剃刀实现LLM极端KV缓存量化
腾讯AI投入拖累利润,资本开支仍将显著扩张
LLM代理记忆系统:超越原子事实的终身记忆新范式
CrewAI 1.14.5 弃用CrewAgentExecutor 改进沙箱与搜索工具
GRASP:确定性论点排序方法解决LLM评判不一致问题
Spherical KV 通过角度域注意力与率失真保留优化长上下文推理
OpenCompass 发布大语言模型通用评估平台
被解雇双胞胎兄弟狂删96个政府数据库
Transformer在数独求解中线性表示高度结构化世界模型
结构化推理信号优于纯代码,新研究揭示提升数学推理关键
ZeroUnlearn提出大语言模型少样本知识遗忘方法
Medicare首创AI医疗代理支付机制,科技界尚不知情
秒哒3.0让8岁小学生用手机做APP,AI应用门槛归零
腾讯AI投入拖累利润增速,Q1研发225亿资本开支319亿
重新思考终身学习LLM智能体记忆:超越原子事实
AI会议同行评审中ChatGPT修改文本的规模估计方法
OpenCompass通用大语言模型评估平台上线