VL-DPO:视觉语言引导的自动驾驶偏好对齐微调
大语言模型基准数据集必须抗污染以避免评估失真
OmniGUI 发布首个全模态智能手机 GUI 代理步骤级基准
Slot-MLLM提出对象级视觉标记化方法优化多模态大模型
ZeroUnlearn实现大语言模型少样本知识遗忘
神经模拟器能量守恒失效:扩散模型能量波动超真实值数万倍
微调大语言模型实现自动化算法设计专用化
ORCA框架:推理时结构化推理提升视觉语言模型抗幻觉与对抗鲁棒性
新研究揭示结构化推理信号比纯代码更有效提升数学推理能力
DecisionBench:面向长期代理工作流紧急委托的多模型基准测试
ReBel方法:基于信念奖励解决长程任务信用分配难题
Mistral AI v1.10.0 发布:Tokenizer v15、推理增强与 Python 3.14
场景分割策略实现黑盒越狱攻击文本到视频模型
PAVE认知架构:生成式智能体在紧急情况下的合理违规
HiDe提出层次解耦:重新审视高分辨率多模态大模型的缩放局限
OScaR:用奥卡姆剃刀原理实现大模型极低比特KV缓存量化
Spatial-MLLM:仅2D输入增强多模态大模型空间智能
VLAs混合训练:思维链增强机器人动作规划
噪声校正GRPO方法:消除奖励噪声实现无偏梯度
ChatGPT对AI会议同行评审影响:大规模监控AI修改文本
PiKV:面向混合专家模型的KV缓存并行管理系统
MaxShapley算法实现生成式搜索公平上下文归因与激励兼容
Transformer在数独求解中建立结构化世界模型
扩散模型预测物理轨迹能量偏差巨大,神经网络难以学习守恒量
Exact Linear Attention 通过核函数精确分解实现线性复杂度无近似注意力
QAM算法借助伴随匹配实现连续动作强化学习策略优化
自适应残差更新引导法低开销缓解大视觉语言模型幻觉
Motif-Video 2B技术报告:用不到10M视频和10万GPU小时实现强文生视频
OmniGUI:首款评估全模态智能手机环境GUI代理的步级基准
阶跃星辰推出音频推理模型 Step-Audio-R1.1
IBM发布Granite Vision 4.1-4B多模态视觉语言模型
Spotify联合ElevenLabs推出有声书创作工具,作者可自由发行
多智能体LLM辩论启用Wald SPRT动态计算调控器
PiKV:面向混合专家模型的并行分布式KV缓存管理系统
Spatial-MLLM:仅用二维输入提升多模态大模型空间智能
LLM基准数据集应具备抗污染能力以保障评估可靠性
HiDe层次解耦纠正高分辨率MLLM的zoom-in认知误区
微调大语言模型用于自动化算法设计
VL-DPO:视觉语言引导微调实现自动驾驶偏好对齐
推理后端对LLM可复现性的量化影响:静默超参数
WARC-Bench发布438项GUI子任务基准,评估多模态AI代理
损失自适应学习率微调防止大语言模型灾难性遗忘
生成式AI交互学习中模型塌缩的发生条件
噪声修正GRPO:从有噪奖励到无偏梯度
SceneSplit越狱攻击:用场景分割绕过文本生成视频模型安全机制
LionMuon交替谱与符号下降降低训练迭代成本
首个针对掩码扩散语言模型的后门攻击方法
MASFactory提出基于有向计算图的LLM多智能体编排框架
字节跳动开源HuMo图像生成视频模型,支持ONNX部署
深度求索发布Janus-Pro-1B:一款任意到任意多模态统一模型