NEWTON:Agentic规划攻克视频生成物理常识瓶颈
Black Forest Labs 推出 FLUX Outpainting 任意方向图像扩展
多机器人协同自我中心空间推理:多模态大语言模型视角融合
CAB:基于修正与校正Adams-Bashforth的无训练流扩散采样加速
SEGS结构能量引导消除文本到3D生成视角偏差
MotionMERGE:多粒度人体运动编辑与生成统一框架
MSAVBench 发布:首个多镜头音视频生成综合评估基准
MIRO 多奖励条件预训练提升文生图质量与效率
文本到图像扩散模型多概念后门注入稳定性研究
概念中心学习让对比模型兼顾组合性与零样本能力
零一万物发布Yi-Coder-9B-Chat对话模型
优必选人形机器人量产交付万台,锚定工业制造刚需场景
开放世界评估:衡量前沿AI能力的新方法
Black Forest Labs 推出 FLUX Erase 与 Outpainting 图像编辑功能
Meta LLaMA 3.3-70B指令模型下载量超91万次
meta-llama/Llama-Prompt-Guard-2-86M
神眸以极致低功耗芯片推动AI智能影像无线化,开启千亿视觉终端时代
Spotify与环球音乐允许付费用户用AI创作翻唱混音并分成
GenTS:面向生成式时间序列模型的综合基准库
CAMERA: Adapting to Semantic Camouflage in Unsupervised Text-Attributed Graph Fr
大语言模型通过物理工具代理发现胰岛素输送聚合物
B-cos GNNs:通过动态线性性实现图神经网络忠实解释
扩散模型实现无训练贝叶斯滤波的动态系统状态估计
线性回归视角下LoRA与全微调的理论风险对比分析
Causal Forcing自回归扩散蒸馏实现高质量实时交互视频生成
百川发布Baichuan-M1-14B-Base医疗大模型
联想全场景AI终端生态蜕变,首发赠1500元天禧能量值
xAI推出Grok技能与OpenClaw集成,赋能智能体
智会心研PLUS免费公测,向创新者开放大厂级研发AI能力
Fast-BEV++: Fast by Algorithm, Deployable by Design
MSAVBench 推出首个全面可靠的多镜头音视频生成评估基准
扩散视觉语言模型在长文本生成中现掩码先验漂移与位置注意力崩溃
一步扩散模型驾驭现实世界时空视频超分辨率
双域自然投影法实现低计算量语义水印高效移除
TADA方法利用激活引导实现音频扩散模型的细粒度属性控制
DeepSeek R1-0528-Qwen3-8B模型发布,下载量突破17万
Black Forest Labs 发布 4B 参数 FLUX.2 klein-base 模型
Lens 3.8B参数超越6B模型,训练算力仅19.3%
百川智能发布Baichuan-Omni-1d5-Base全模态模型
stabilityai/stable-audio-open-small
DeepSeek-Math-V2发布,数学推理模型支持FP8量化
stabilityai/stable-virtual-camera
MOSS 通过源代码级重写实现自主代理系统自我进化
InternVL3.5-241B-A28B-Flash:241B参数多模态模型仅28B激活
SandboxAQ 将药物发现模型接入 Claude,降低博士级计算门槛
Google 推 Android CLI 工具,支持 AI 编码代理加速应用开发
Phantom 联合视觉与潜在物理动力学生成物理一致视频
AI集成系统超越尺寸生长标准,直接实现肺癌结节检测与诊断
HL-OutPaint 提出粗到细方法实现高分辨率长视频外绘
SAM提出不确定性-精度关联方法提升域外分割可靠性