AIGC规模超越偏好:千万用户数据揭示内容生态重塑
多示例思维链上下文学习让大模型真正学会推理
生成模型水印应作为监控原语,内部监控不可回避
因果感知端到端自动驾驶:自车中心联合场景建模
几何与谱分析揭示低秩预训练泛化能力的本质差异
多Agent LLM分布式信息集体推理存在系统性失败
MinT:面向百万级大模型训练与服务的托管基础设施
RIGVid:机器人仅凭模仿AI生成视频完成复杂操作,无需物理演示
AI co-mathematician 工作台:数学家与AI代理协作探索开放研究
高阶线性注意力HLA实现长上下文因果流式交互
低秩预训练几何与谱研究:泛化能力与全秩训练对比
AI Harness工程:运行时基座提升基础模型软件代理可靠性
大语言模型规模定律与架构设计:推理效率权衡研究
CodeClash基准:面向目标导向软件工程的AI编码能力评估
AI co-mathematician工作台:用智能体加速开放数学研究
MoE压缩新发现:生成任务中专家剪枝优于合并
TTT与KV绑定实为线性注意力机制的形式化重释
Deep Delta Learning:Transformer残差层选择性重写机制
Agent² RL-Bench 评测:LLM 智能体自主完成强化学习后训练能力
扩散模型突破约束:基于RL与MCTS的序列自回归生成
Zatom-1:统一分子与材料3D建模的跨领域多模态基础模型
HiddenBench基准揭示多智能体LLM分布式信息下集体推理系统性失败
arXiv论文警告:自动化AI对齐可能产生误导性安全评估
FOAM:分块状态折叠实现LLM训练内存优化
HLA高阶线性注意力:突破一阶限制的因果流式交互机制
GUIGuard-Bench提出通用隐私保护GUI代理评估基准
扩散模型约束失效,自回归生成结合RL与MCTS突破限制
THINKSAFE 以自生成安全对齐解决推理模型过度服从风险
异步推理实现大语言模型无训练交互思考
CodeClash:目标导向软件工程编码基准
通过流形投影改进流匹配的无分类器引导
FOAM提出分块状态折叠法降低LLM训练内存占用
B站研究揭示AIGC规模主导内容生态,用户偏好退居次位
LADD 提出潜在增强离散扩散,在联合空间扩散提升少步生成
最优控制视角下的流图奖励引导少步对齐方法
PBT-Bench:评估AI智能体属性测试能力的专属基准
地球科学基础模型:从感知到推理与科学发现
检索增强多智能体框架实现医疗对话系统自动化可靠评估
层间几何结构优化LLM最终表示方法
Transformer学习语义关联的机制:梯度主导项带来可解释性
Deep Delta Learning:Transformer残差流的选择性改写机制
研究发现TTT与KV绑定架构本质上等同于线性注意力
Predict-Project-Renoise:迭代投影再噪化实现扩散模型硬约束采样
三十字提示即可诱使GPT等12款大模型推荐高价赞助商品
GUIGuard-Bench:面向GUI代理隐私保护的通用评估基准
BlitzGS索引奇偶分片实现城市级高斯泼溅闪电重建
Mistral AI 推出 Medium 3.5、远程编码代理及 Le Chat 工作模式
MXFP4量化引发Llama 3.1-8B全流水线FP4训练发散
异步推理:LLM无需训练即可实时交互思考
流匹配无分类器引导的流形投影优化方法