混合验证解码:LLM推测解码中验证分配的优化
大语言模型内部先验限制零样本注释任务适应性
字节跳动Bernini-R图像文本转视频模型
分布对齐自蒸馏:动态Token选择提升推理鲁棒性
Nvidia 发布 GR00T-H-N1.7 机器人基础模型
SALSA提出监督学习转向向量实现语音感知LLM自适应
OCC-RAG:面向忠实问答的最优认知核心小语言模型
软提示技术实现大语言模型幻觉轻量级缓解
MemPro:将智能体记忆系统设计为可进化程序
NVIDIA发布Cosmos3 Nano策略模型DROID版本
多智能体LLM辩论立场趋同三源分解:自发、从众与推理说服
SPADER:多样感知探索奖励的逐步同行优势用于多答案问答
Momento基准评估多会话代理持久记忆与推理能力
大语言模型个性化共情:根据用户性格调整共情策略
D3IM:采样器匹配训练实现掩码扩散语言模型的自纠正
在线自蒸馏:强化学习策略内部化温度防熵坍塌
自进化语言模型推理在封闭场景下的泛化差距研究
LUNA:语言学自适应单token无失真大模型水印
PillarDETR:YOLO骨干结合RT-DETR头实现实时3D目标检测
多模态动作扩散实现鲁棒端到端自动驾驶
arXiv论文提出高效RAG:意图感知检索与语义保持分块
Mamba-2状态汇:单桶探针仅捕获少量执行层,遗漏大半检测层
HarnessForge提出联合策略与执行框架实现智能体系统自适应演化
CA-BED对话感知贝叶斯实验设计优化LLM主动信息获取
HypothesisMed:推理时答案融合与结构化假设空间报告用于生物医学问答
后训练推理数据入门:综述150余篇文献揭示工作原理
大模型局部约束解码偏差缓解:可处理提议与序贯蒙特卡洛方法
LLM异步规划借助自动形式化:三新基准填补执行时序约束空白
大模型引发论点坍缩,公共辩论趋于扁平化
共振上下文锚定:解耦注意力路由与信号增益消除LLM上下文忽视
CRAM:质心路由与自适应MoE实现多模态持续指令微调
SkillHarm揭示AI Agent技能全生命周期安全漏洞与攻击面
新研究提出子模块替换压缩,突破LLM压缩层粒度限制
ResMerge 提出残差谱合并方法解决 RL 专家模型融合难题
多模态大模型空间推理存在词汇偏差:添加空间关系词即诱导选择
BAGEN提出预算感知智能体:将预算从被动成本转为主动控制信号
LLMs在具体政策投票中不延续抽象问卷左倾偏见
SimSD让扩散语言模型支持token级推测解码加速
DECK分类法:依一致性×置信度标记LLM幻觉的可检测性
社会工程攻击高效窃取前沿AI代理的用户PII数据
Pramana借助Navya-Nyaya微调大模型提升认知推理能力
成本感知RAG:付费知识环境下预算受限的证据选择方法
SentGuard:句子级流式护栏实现大模型实时安全干预
ProbeScale 通过探测分析优化神经缩放定律,加速小模型推理
质量-多样性进化框架发现大模型安全攻击多样性
Grokers:写入时智能驱动的类型知识图谱归纳理解架构
PaSBench-Video 发布流视频主动安全预警基准测试
TVIR 提出文本-视觉交错报告生成基准及深度研究代理构建
LayerRoute:基于LoRA的自适应层跳过方法降低智能体模型推理成本
块级引导生成:现成LLM作为数学推理过程评分器