Vegas 以验证引导稀疏注意力实现自推测解码加速长上下文推理
前美团外卖技术负责人王栋创业元节智能,打造餐饮具身世界模型
Aippy完成数千万美元首轮融资,估值2.5亿美元打造AI游戏社区
参考引导深度压缩VAE实现实时流式说话人肖像视频生成
MORPHOS:基于时间结构化潜变量的自回归4D动态生成
Pinterest Canvas 发布大规模图像生成系统,支持编辑与增强
HumanNOVA:单图生成逼真通用快速3D人体头像模型
百度文心PaddleOCR-VL-1.6文档解析准确率96.33%刷新SOTA
佛罗里达州起诉OpenAI与Altman,指控ChatGPT卷入枪击案
Anthropic向欧盟网络安全局提供Mythos模型使用权限
OmniHuman推出大规模人物视频数据集与生成基准
豆包确认6月下旬正式付费并打通抖音电商
结构化推理使LLM能有效自我定位推理错误
Expanse 预测工作负载需求,解锁 HPC/GPU 集群闲置容量
深度研究作为强化学习评分标准:评分准则构建本身是研究课题
Nvidia推出Cosmos3-Super文本生成图像模型
PolySpeech-100:覆盖百余语言方言的语音理解基准发布
CRAB-Bench与RUSE:面向复杂任务依赖和拟人用户模拟的LLM智能体评估
DSL-LLaDA:连续去噪扩展至8B参数掩码扩散模型化解长度-质量权衡
非合作博弈框架下的语言模型安全对齐训练方法
LLM通过接地交互合成扩展智能体能力
CoT推理熵动力学揭示两阶段:从探索到高可靠收敛
MineDraft批量并行投机解码框架,打破顺序执行瓶颈
Qwen-VLA:统一视觉-语言-动作,跨任务、环境与本体
Thyme与DeepEyesV2研究质疑多模态智能体工具使用的真实收益
扩散模型生成路径坍缩的判定与修正方法
视觉语言模型无法推理物理变换中的守恒原理
清华AIR开源UniLab,3分钟完成人形机器人运控训练提速10倍
AWS 推出前沿代理,实现安全测试与云运维自主化
全球Top10 AI实验室无限期免费开放首个全模态API
VAST获近2亿美元融资,明确世界模型技术路线
WindBorne用自有气球数据使AI天气预报精度超越政府机构
阿里云Qwen3.7-Plus上线,多模态智能体一键复刻桌面专业软件
Anthropic提交IPO申请,从AI黑马到上市巨头
Starship's Twelfth Flight Test
黄仁勋预测英伟达AI代理CPU市场达2000亿美元
结构反压优于智能代理:Reuben Brooks用形式化验证门控AI编码循环
吴恩达投资IrisGo打造AI桌面助手,自动学习替用户执行任务
英伟达创纪录营收但增速放缓,披露430亿初创公司持仓
yapsnap:纯CPU转录YouTube、TikTok、X、Instagram视频
xAI去年亏64亿美元,SpaceX文件揭示Grok扩张不止
英伟达第一财季净利润583亿美元同比增211%
AWS发布用于安全测试和云运维的前沿代理
Stability AI推出Stability Audio 3.0,可生成6分钟完整歌曲
Cohere 推出首个 MoE 模型 Command A+,主打高效开放权重
NanoClaw创建者放弃2000万美元收购,获1200万美元种子轮融资
Intuit裁员超3000人,全面转向AI战略重心
智象未来超两千亿参数图像大模型HiDream-O1-Image-Pro发布,融资提速
Anthropic有望首次实现单季盈利,收入大幅增长
Stability AI 发布 Stable Audio 3 优化版,实现文本转音频