基于Mag1c-SAS和LinkNet的星载快速甲烷检测管道
PHAF新方法:两张照片即可生成个性化手部逼真头像并实时部署
TreeFlash并行AR近似方法加速推测解码
空间转录组学引导对齐增强病理基础模型分子剖析能力
多头部早退优化RAG-LLM推荐系统的效率与准确率权衡
VLESA:视觉语言具身安全代理用于人类活动实时监控与危险干预
LLM-as-Judge 评估噪声:分布校准聚合方案减少单样本不一致性
黑盒自适应可迁移攻击:突破LLM安全护栏
LiveBand 高保真因果对抗实时音频伴奏生成器
物理信息谱扩散模型PISD求解偏微分方程正反问题
Ref-DGS 双高斯泼溅框架高效建模近场镜面反射重建
FLIPS:基于伪随机序列的LLM实例指纹识别方法
Anthropic提出宪法式同策安全蒸馏新方法
LLM测试时优化物理查询计划,超越传统成本模型
自适应约束指导扩散模型实现无机晶体结构免微调生成
SVHall新基准:评估音频-视觉大语言模型语音与视觉对齐幻觉
TASTE 提出新方法提升 AI Agent 基准测试覆盖度与难度
Phantom Transfer数据投毒攻击:已知毒源仍无法被过滤
VulnAgent-R2:多智能体证据校准实现仓库级漏洞检测
KForge:LLM驱动的跨平台AI加速器内核生成
MetaWorld:基于单视角视频数据扩展多智能体视频世界模型
AirDreamer 利用世界模型实现通用无人机导航
Plan2Map:从规划记录重建地理空间边界的多模态基准
Qwen-Image-Flash:少步蒸馏训练配方超越设计目标
面向复杂图像编辑的鲁棒序列分解方法提出
多LoRA合并为单一低秩适配器方法研究
SEAOTTER:传感器嵌入式自动编码实现一次性转码高效重建
Greed is Good:无训练引导生成的后验与端到端统一视角
CP-Agent:上下文感知多模态推理实现化学扰动下细胞形态分析
EvoDrive:帕累托进化结合自改进LLM生成自动驾驶安全关键场景
PyraMathBench 发布 3.2 万题层次基准,评估 LLM 数学推理与数值处理
多智能体LLM系统Ringelmann效应缩放定律:三种渐近规模分类
StepFinder:多智能体系统故障归因时序语义框架
Hedge-Bench:面向金融推理的硬核开放问题基准
SLM智能体编排网关:AI虚拟世界从提示到服务的架构革新
诊断LLM新型API获取知识缺口:NovelAPIB基准
NTK-UQ用经验神经正切核实现极端天气预报不确定性量化
DeskCraft 提出专业工作流与人类协作的桌面智能体基准测试
核心层次结构提升GraphRAG全局语义理解效率
CORE冲突导向推理:通用多模态操纵检测新方法
对抗性补丁劫持VLA模型CoT推理导致机器人行为误判
前沿语言模型评估意识分解与测量研究
自主智能体基准测试忽略放弃能力:合规偏差需纳入评估
ClinicalMC 多病程临床决策基准:评估大语言模型动态病情决策能力
AI编码代理任务中断引发“交接债”:重新发现成本攀升
视觉指令微调通过抽象将视觉特征嵌入LLM中间语义层
图结构用作大语言模型内部推理组织支架
DMF:以CPU优先的确定性记忆框架替代LLM生成式压缩
SleepVLM:基于视觉语言模型与AASM规则的可解释睡眠分期
模型合并导致MoE路由崩溃,免训练校准方案提出