理论证实多元偏好可避免生成模型合成数据训练崩溃
在线自然语言反馈实现语言模型高效对齐
LLM代理内存中毒攻击:四大写入通道与九大漏洞
TamperBench提出系统性压力测试评估LLM微调篡改安全性
微信Agent被叫停推迟发布,腾讯为何紧急叫停?
LLM攻击基准覆盖审计:基于STRIDE的4×6矩阵框架
指尖智擎完成数千万元Pre-A轮融资,深创投领投
Robust-LLaVA:大规模鲁棒图像编码器增强多模态大语言模型抗扰动性
X-Omni先想象再绘图:视觉提示工程降低文本图像建模难度
MeshWeaver提出稀疏体素引导表面编织的自回归网格生成
生成图像模型文化偏见评估:六国多类别统一诊断框架
GPUA实现异构视觉基础模型的几何保持无监督对齐
路径条件训练:重缩放ReLU神经网络的原则性方法
联合潜在扩散模型实现单图像反射与透射层分离
LARM用深度条件循环变换器实现ASR测试时计算缩放
STaR-Quant 提出状态时间一致量化法优化扩散大语言模型部署
最优传输流匹配新方法解决高维耦合计算难题
概念增量定制:扩散模型实现个性化概念持续学习
UC Berkeley CS课程因AI使用激增,数学能力下滑致不及格率飙升
Aryabhata 2用强化学习扩展高级STEM推理能力
ContactExplorer 用接触覆盖引导探索实现通用灵巧操作
LoRA-as-Tools新框架:将适配器作为可调用工具实现动态专家路由
ZeroWBC:从人类自我中心视频学习自然全身人形交互
自省式API用结构化建议提升AI agent任务恢复成功率
研究质疑概率置信度在Best-of-N选择中反映推理质量的有效性
谷歌Dreambeans将个人数据变成AI卡通故事
AutoLab 新基准:前沿模型能否胜任长周期自动驾驶研发任务
FALSIFYBENCH:用规则发现游戏测试大模型归纳推理能力
大语言模型突破符号局限:实现几何空间推理
Ptah多智能体框架实现可验证交错多模态深度研究报告生成
dMX:可微分混合精度量化框架自动分配LLM浮点位宽
SSSD推出简单可扩展推测解码方案,加速LLM推理无需额外模型
分布化DAgger框架:利用执行轨迹等丰富反馈强化推理模型
Video2LoRA:单次前向将视频内化为LoRA降低VLM推理成本
LifeSide发布终身数字伴侣基准:多会话记忆-情感-环境循环
APB诊断基准:4209例多模态任务区分LLM智能体规划与执行失败
SePO自我进化提示代理实现系统提示自动优化
基础模型研究因成本过高转向近似实验引发有效性威胁
扩散大语言模型动态填充锚点实现灵活格式约束生成
WETBench基准发布:专测维基百科特定任务机器生成文本
DLLG:动态Logit级门控实现LLM专家Token级融合
同人小说子类别成为对齐大语言模型的通用越狱攻击载体
ACAT:高效协作式方面级情感数据集标注平台
POLARIS提出GRPO训练法让小模型写出连贯长故事
大语言模型提出后推理范式:将推理链作为上下文输入
微调Transformer在Reddit错误信息分类中完胜零样本LLM
LazyAttention 用延迟位置编码提升 RAG 缓存复用效率
llama.cpp 修复 Gemma 4 统一 FPE 问题
扩散大语言模型遭结构感知自适应攻击MaskForge越狱
DeepSeek-V4 初始化兼容性修复:解决 CUTLASS fmin 问题