HAVEN提出层次对齐多模态基准,统一视频理解评测
Stability AI 发布 stable-point-aware-3d 实现图像到3D生成
DecepChain研究揭示大模型可生成看似合理但错误的欺骗性推理
Transition Matching 超越 Flow Matching 的理论条件与证明
DMD去假分数网络的分布匹配蒸馏新方法
MLCommons Chakra:标准化执行轨迹助力AI性能基准与协同设计
MIRO提出多奖励条件预训练提升文生图质量与效率
文生图扩散模型遭多概念后门注入:开源生态藏隐患
异构感知数据集调度助力音频大语言模型高效训练
切片特征蒸馏实现神经网络快速张量化压缩
CAMERA:无监督文本属性图欺诈检测的语义伪装适应
WILDFIRE-FM专为野火预测预训练,挑战通用地球模型实际效能
PhyWorld提出物理保真世界模型确保视频生成符合物理状态
Soft Learning:跨模型专家库加权组合实现最优学习
DarkLLM提出语言驱动的对抗攻击新方法
Ex-GraphRAG可解释证据路由:图增强LLM结构审计新方案
AI去面具技术被指不适用于身份识别
Black Forest Labs 推出 FLUX Outpainting 实现任意方向图像无缝扩展
苏姿丰上海演讲:AI重构计算每一层,AMD加码中国开发者生态
认知遗憾最小化:大语言模型无标签因果批评替代结果奖励
AgentEscapeBench:LLM智能体越狱式工具推理评估新基准
字节跳动发布Lynx:图生视频与身份保留模型
OpenGVLab发布InternVL3.5-241B-A28B-Flash多模态模型
Stability AI 开源文本生成音频模型 stable-audio-open-small
字节跳动BindWeave图像转视频模型发布
SpecBench揭示长周期编码代理的奖励黑客风险
闭环动态驾驶数据混合优化自动驾驶真实-合成协同训练
LLM链式思维混淆经输出监督训练可泛化至未见任务
月之暗面发布Kimi-VL-A3B深度思考版模型
阿里巴巴开源Ovis2.5-9B多模态大模型支持图文交互
字节跳动UMO:基于Diffusion-Transformer的主体个性化图像生成
BAAI RoboBrain2.5-4B视觉语言模型发布
Stability AI 发布图像转 3D 模型 Stable Point Aware 3D
Frontier:实现全面准确大语言模型推理仿真
REFLECTOR框架通过内化逐步反思防御LLM间接越狱攻击
字节跳动开源Lynx图像转视频模型
大语言模型安全对齐需实现上下文不变性以抵御对抗性改写
大语言模型类人推理的持续涌现被追踪
Orchard开源代理建模框架,赋能LLM自主智能体开发
LLM/RAG应用就绪度评估框架:集成可观测性与CI质量门
RRB基准测试:Claude在文本扰动下推理能力落后于其他前沿模型
字节跳动发布BindWeave图像转视频模型
字节跳动Timer-S1时间序列预测基础模型发布
月之暗面开源轻量级多模态思考模型Kimi-VL-A3B
智源开源RoboBrain2.5-8B-MT多模态模型
字节跳动USO模型实现主题个性化与风格迁移图像生成
ChronoMedicalWorld 模型:从纵向护理数据学习患者轨迹预测
阶跃星辰发布Step-Audio-R1.1音频推理模型,支持链式思维
基于世界模型模拟推理的通用智能体规划
BAAI开源Emu3.5视觉分词器,支持自定义代码与安全张量