生成扩散先验实现暗宇宙三维弱引力透镜映射
PETS: A Principled Framework Towards Optimal Trajectory Allocation for Efficient
DREAM-S:搜索式草稿与目标感知精炼加速多模态生成
Avatar Forcing: Real-Time Interactive Head Avatar Generation for Natural Convers
Scaling Search Relevance: Augmenting App Store Ranking with LLM-Generated Judgme
CaptionFormer统一视频对象分割、跟踪与密集字幕生成
SceneSmith:分层智能体框架生成高仿真室内场景
多视图证据学习新方法攻克深度伪造语义掩蔽效应
OpenHospital:面向LLM集体智能演化与基准测试的交互式竞技场
罗生门记忆:面向多视角智能体记忆的论证驱动检索方法
UI-in-the-Loop:多模态GUI推理从屏幕到行动的缺失环节
Cookie-Bench:Web生成连续屏幕交互的评估新基准
LocalSearchBench: Benchmarking Agentic Search in Real-World Local Life Services
T-POP用在线偏好反馈实现测试时个性化,解决冷启动
半监督超图概念瓶颈模型实现标签高效可解释医学图像诊断
虚假相关性破坏VLM安全微调,机器遗忘可消除安全幻象
REBot提出CatRAG框架:融合密集检索与图路由的增强生成
Dynamic Trust-Aware Sparse Communication Topology for LLM-Based Multi-Agent Cons
InfoAtlas:零样本统计依赖估计的互信息基础模型
统一栅格与向量语义的人类中心地理空间基础模型
Iteris 智能体研究循环赋能计算数学自动探索
PR2预测路由重放缓解MoE大模型强化学习路由漂移
ChronosAD 利用时间序列基础模型实现精准异常检测
APB-V用序列并行近似注意力加速长视频理解
LLM编码代理第三方技能藏恶意指令,9.8万技能安全分析揭示风险
LLM演化模式生成器实现可采纳启发式最优经典规划
Crazyflow: An Accurate, GPU-Accelerated, Differentiable Drone Simulator in JAX
对抗性信息流可操纵LLM代理决策偏离预设行为
ReasonBENCH基准测试揭示LLM推理结果的随机性与排名误导风险
AMP: A Vendor-Neutral Wire Format for Agent Memory Operations
LLM辅助Windows漏洞研究:规模化二进制目标选择方法
MOSS-Audio Technical Report
用Crawford-Sobel模型构建LLM诚实性基准,评估利益冲突下的真话
ProtoT:用原型替代自注意力的线性成本可解释语言模型
多阶通信MOC:突破LLM多智能体系统消息感受野限制
MemGraphRAG: Memory-based Multi-Agent System for Graph Retrieval-Augmented Gener
Monitoring Agentic Systems Before They're Reliable
MulFeRL: Enhancing Reinforcement Learning with Verbal Feedback in a Multi-turn L
状态跟踪任务扩展推理失效,工具委托成必要
几何潜在推理方法显著缩短大语言模型生成文本长度
结构视角揭示大语言模型多语言处理的内在机制
LLM价值权衡受性别线索影响?RVDB基准测试给出证据
AXIOM:信任优先的神经符号执行架构实现可验证数学推理
PMC-InterCPT:生物医学交织数据重构多模态持续预训练
训练提示词决定微调效果:状态自适应优化提升大模型鲁棒性
MENTIS方法:测量语言模型对齐后的内部多尺度潜在扭转
EvoNote:基于经验记忆自我进化的LLM代理生成健康社区证据纠错笔记
WaveFilter:用小波引导KV缓存过滤提升扩散LLM长上下文能力
论文提出双粒度偏好学习实现Agent技能选择性调用
LaSR:基于潜在推理的上下文感知语音识别