超双曲与证据优先专家:新MoE架构解决LVLM模态不对称
视觉链式思维代理:工具多样性优于频率,用于3D与医学推理
RuleEdit:规则引导的AI模型编辑系统,可预检失败与影响
深度研究代理轨迹中的跨度级错误定位新方法
WorldCoder-Bench:评估LLM生成物理正确3D世界的基准
RAFT数据精炼与自适应蒸馏:缓解领域微调中的能力遗忘
MemGraphRAG:记忆型多智能体图检索增强生成
从人类视频到机器人操作:可扩展视觉-语言-动作学习综述
SIRI框架让LLM智能体自我内化技能无需外部生成器
eMoT:符号锚定与记忆腐蚀驱动LLM思维记忆进化
研究:具身视觉语言规划需从语言预测转向物理因果推理
DAPD:基于注意力的依赖感知并行解码加速扩散LLM
BudgetDraft提出接受感知多视图训练,实现稀疏KV投机解码
LLM智能体工具调用:有效性衡量与RL训练效率研究
What Makes a Strong Model? A Unified Spectral Analysis of Knowledge Transfer ove
CaB方法:有限校准下VLA代理的完成感知边界切换部署
Persona Attack利用记忆注入越狱攻击大型语言模型
CEAR认证集成防御为DNN提供可证明对抗鲁棒性
FoLoRA:基于广义瑞利商优化的基础模型能力保持微调方法
MURMUR高效长语音识别推理系统平衡精度与延迟
PaCo-VLA:用被动屏蔽合规先验填补语义到控制鸿沟
A Unified Evaluation-Instructed Framework for Query-Dependent Prompt Optimizatio
FeynmanBench:多模态大模型图表物理全局推理基准
LLM Agent解析Linux内核故障诊断的复杂性
Towards a Virtual Neuroscientist: Autonomous Neuroimaging Analysis via Multi-Age
Knowledge-Intensive Video Generation
GraphCast机器学习模型将大气可预报性扩展至30天以上
查询电路:直接追踪信息流解释语言模型如何回答用户提示
过程奖励代理引导知识密集型推理新方法
Benchmarking at the Edge of Comprehension
大模型跨实例注意力重分配:移动查询而非缓存
Distillation of Large Language Models via Concrete Score Matching
批次大小隐藏偏差:LoRA变体性能差异实为超参数假象
Coding Agent Is Good As World Simulator
Moment-Video诊断视频MLLM对瞬间视觉事件的时序保真度
符号神经生成器SNGs用于药物设计先导化合物发现
TrafficClaw: A Generalizable LLM Agent in the Unified Physical Environment for U
Atomix:事务性工具调用实现可靠Agent工作流
APEX-SQL:基于智能体探索的Text-to-SQL框架
Feature to Dynamics: Feature-space to Autoregression strategy for Zero-shot Time
强化学习实现LLM分词器端到端训练
世界模型全面综述:架构、方法论、推理范式与应用
DetailMaster:文生图模型长提示词能力评测新基准
IMWM: Intuition Models Complement World Models for Latent Planning
IDLM: Inverse-distilled Diffusion Language Models
PINNs训练难题:噪声Feynman-Kac监督与算子预处理方法
DeepLatent并行潜在视觉推理:模型通过图像进行中间思考
Chatterbox-Flash:块扩散解码器实现零样本流式并行语音生成
世界任务因子分解:机器人学习策略的结构化泛化方案
粗到细组合扩散生成局部一致的长时程规划