混合光学-数字架构实现可扩展节能深度伪造视频检测
TideGS外存优化实现单GPU训练超十亿3D高斯溅射基元
Wald-SPRT动态调控多智能体LLM辩论轮数
QAM算法:伴随匹配Q学习高效优化连续动作扩散策略
Phantom:联合视觉与潜在物理动力学的物理注入视频生成
MVI-Bench:评估大型视觉语言模型对误导性视觉输入鲁棒性的新基准
Motif-Video 2B:以不足千万片段和十万GPU小时实现强视频生成
AnyAct:从非人类角色视频直接重演可编辑人类动作
首个针对掩码扩散语言模型的后门攻击方法提出
抖音推荐系统实现端到端万级用户行为序列建模
LongLive-2.0 基于 NVFP4 并行架构加速长视频生成全流程
沉默超参数:量化推理后端对大语言模型可重复性的影响
Artifact-Bench:评估多模态大模型对AI视频伪影的检测能力
MaxShapley:生成式搜索公平归因算法推动内容补偿机制
MSAlign:对齐分子与质谱基础模型提升代谢物鉴定精度
HCLBind提出分层对比学习预测多域蛋白质-配体结合
Artifact-Bench评估多模态大模型对AI视频伪影的检测与判别
合成数据污染下结构化交互学习的模型崩溃条件
LionMuon:交替谱与符号下降实现高效训练
Together AI 推出 FlashAttention-4 及 ATLAS 加速器,推理速度提升 1.3-4 倍
xAI推出Grok Skills与OpenClaw集成,支持文档生成和工作流自动化
场景-动作提示融合框架实现连贯文本到视频故事生成
损失自适应学习率微调方法防止大模型灾难性遗忘
小米EV世界模型:融合重建与生成的自动驾驶统一框架
OpenAI联合创始人卡帕斯加盟Anthropic预训练团队
MVI-Bench:LVLM对误导视觉输入鲁棒性评估基准
Google推出AI信息代理,后台监控主题并主动提醒更新
ElevenLabs 年化收入突破5亿美元,获BlackRock、NVIDIA等投资
Cursor新模型1/10成本实现Opus 4.7级表现,马斯克发声
从黑客到研究员,Ocean创始人获2800万美元打造AI反钓鱼邮件平台
从黑客到安全专家,Ocean获2800万美元融资对抗AI钓鱼
谷歌Genie世界模型整合街景,实现真实街道沉浸模拟
Databricks 发布 KARL 代理,以定制强化学习加速企业知识检索
Gmail引入Gemini语音搜索,对话式查询隐藏邮件细节
Forge开源护栏层让8B模型agentic任务准确率从53%飙升至99%
Figma为协作画布配置AI助手,首发于设计工具
Remove-AI-Watermarks 开源工具可移除 AI 图像水印
OpenAI加入C2PA并集成SynthID以加强AI图像检测
Google IO 2026升级Gemini:从聊天机器人迈向全能AI中心
DeepSeek-OCR-2 发布:支持多模态图文理解的二代 OCR 模型
OpenAI与谷歌加码新加坡AI投资,争夺东南亚市场
DeepSeek-V3.2 模型上线,下载量超400万
Mistral AI 收购 Emmi AI 强化欧洲大模型生态
字节跳动发布Ouro-2.6B-Thinking循环深度推理模型
Google AI Studio 让任何人都能在几分钟内构建原生安卓应用
Google Universal Cart上线:跨设备跨零售商追踪用户完整购物路径
SAM提出不确定性-精度鲁棒关联解决域偏移掩码置信混淆
HOI-PAGE提出基于部位功能推理的零样本4D人-物交互生成
PanoWorld:基于平面图与风格参考生成一致全屋全景VR漫游
STABLE语义-物理双系统生成仿真就绪桌面布局