ToolSelf: Unifying Task Execution and Self-Reconfiguration via Tool-Driven Emerg
RescueBench:评估具身代理在野外搜救中的多阶段交互与空间记忆能力
FundaPod:多角色智能体平台与知识图谱记忆辅助基本面投资研究
AnyMo利用掩码建模实现任意模态条件运动生成
DeepIPCv2:基于LiDAR的端到端自动驾驶感知与控制框架
Large Electron Model: A Universal Ground State Predictor
Genotype-Conditioned Molecular Generation via Evidence-Grounded Multi-Objective
SHERLOCK框架:动态知识适应提升大模型电商风控效能
EvoCut:多层演化感知视觉令牌压缩,高效LVLM推理
UniPinRec统一生成式检索与排序,降低Pinterest推荐系统算力成本
随机擦除对抗模型反转:有效防御还是空幻想?
DuetServe:自适应GPU多路复用协调LLM预填充与解码阶段
R3-CoVR:零样本推理感知组合视频检索框架
Chroma Clues 利用颜色统计特征检测 AI 合成图像
SliceScorer:驾驶VLM测试覆盖缺口可解释发现新方法
2047基准数据集实验:数据泄漏中估计类可忽略,选择类影响显著
Learning Action-Conditional and Object-Centric Gaussian Splatting World Models f
MOGKAN框架利用多组学与PPI网络实现多癌症分类及生物标志物识别
OptiWorld将最优控制引入视频生成以解决物理约束下的轨迹问题
机器学习工作流语法:调用时拒绝数据泄漏
4D雷达与LiDAR、摄像头协同:恶劣天气下感知新方案
TradeArena审计框架揭示LLM交易代理行为对齐与风险反馈机制
FlowNar:一种面向长视频的可扩展流式叙述新框架
WorldCache异构Token缓存加速扩散世界模型推理
FineVerify:细粒度自验证框架扩展测试时计算以提升智能搜索性能
DuckDuckGo 推出无AI浏览器扩展,流量暴涨下简化访问
沙盒编码代理仅凭文本+图像在音视频基准上超越原生全模态模型
Auteur 语言驱动视频生成实现以人为中心的摄像机取景
CultureForest:大模型文化规范推理评估新基准
连续流语言模型FLM用确定性ODE突破离散扩散因子化采样瓶颈
UniKE基准揭示文本知识编辑难以泛化至多模态视觉生成
DiscourseFlip:针对黑盒RAG系统的话语级观点操纵攻击
AI评审能否提升论文起草质量?20篇计算机架构稿件实证
AI代理在常规电脑使用中因任务驱动产生越轨行为
利用梯度偏差检测大模型预训练数据的新方法
LLM偏好对齐新方法:迭代纳什优化中的高效探索策略
深度研究代理专家咨询评估基准:验证器、评分标准与认知陷阱
分组优先离策略优化提升LLM推理RLVR效率
大模型安全对齐的伦理困境:TRIAL方法嵌入有害请求于道德框架
奖励分数匹配统一流与扩散模型的奖励微调方法
RDA:强化学习的奖励设计智能体
利用输出分布熵实现无训练视频推理的新方法
GEO-Bench基准:衡量生成式引擎中排名操纵的方法与可检测性
MomentKV 消除长上下文推理中 KV 缓存淘汰的方向偏差
GPTQ-intrinsic LoRA 实现近最优低比特量化与低秩适配
ViBE协同优化负载倾斜与硬件变异以加速MoE推理服务
反射式智能体记忆虚构:错误记忆导致任务持续失败
复杂性最小化框架证明元学习数据缩放定律
NVIDIA Blackwell NVFP4精度下LLM预训练无偏梯度估计改进
最优性如何塑造稀疏字典:一种理解稀疏自编码器表征的新理论