PhysX-Omni统一框架生成刚体、可变形与关节物体的仿真就绪3D资产
FRED多模态自动驾驶数据集:专攻洪水路面场景
IBM 发布 Granite Switch 4.1 3B 文本生成模型预览版
面壁智能首个Release发布,支持MiniCPM多模态模型及Intel显卡加速
IBM发布Granite Embedding多语言嵌入模型311M支持多种格式
IBM开源Granite Switch 4.1-8B预览文本生成模型
IBM Granite 发布多语言语音识别模型 granite-speech-4.1-2b
Mistral-inference v1.1.0 新增 LoRA 模型推理支持
SWE-MiniSandbox:无容器强化学习训练软件工程智能体
Mistral v1.10.0 带来 Tokenizer v15、推理能力与 Python 3.14 支持
InternLM-v0.2.0发布,支持流水线并行与序列并行等特性
InternLM v0.2.0 新增流水线与序列并行及评估功能
InternVL-Chat-V1.2 发布:借鉴 LLaVA-NeXT 的多模态对话模型
可证明保护微调LLM免受训练数据提取并保持效用
IBM Granite Vision 4.1-4B视觉语言模型正式开源
增量秩1联想记忆专家混合实现无遗忘持续学习
OLMo研究揭示性别偏见从预训练数据到对齐的传递路径
Event-Aware Prompt Learning 让动态图学习感知历史事件
SPECTRA提出频谱域感知图生成方法应对分子性质回归数据不平衡
CEDAR:通过自适应旋转实现视觉语言模型嵌入的稀疏解耦
Open-Sora 1.1发布:支持0-15秒视频、144p至720p多分辨率
HuggingFace TRL v1.4.0 分块交叉熵损失降低 SFT 显存消耗至多50%
LCGuard:多智能体系统KV共享的潜在通信安全防护方案
X-OmniClaw发布统一移动智能体技术报告,支持多模态理解交互
重尾引导的大语言模型逐层学习率方案
HuggingFace PEFT v0.19.0 发布九种新微调方法
StockR1利用一致性强化学习实现金融大模型可验证推理
优化器诱导谱缩放定律:同架构FFN不同容量
对抗蒸馏中鲁棒教师为何失败:置信度错位机制揭示
IBM发布Granite Switch 4.1-30B预览版文本生成模型
智谱AI推理速度达400 tokens/s,领跑顶流模型
Charon:大规模LLM训练与推理的统一细粒度模拟器
多LLM基准测试的可证明联合去污方法
OmniVL-Guard Pro:工具增强代理实现开放世界视觉语言取证
MoLEM提出生成式动态混合潜在记忆助力智能体自我进化
Mistral推理库v1.1.0新增LoRA模型推理支持
反图灵测试揭示:Stable Diffusion、DALL-E生成图像检测难题
滴滴 D³-Subsidy 在线序列化司机补贴决策优化
大语言模型实现虚拟细胞自主机械推理新方法
AI辅助药物决策系统可靠性不足引发安全风险
Mem-π:LLM代理通过学习何时生成什么实现自适应记忆
区块链赋能LLM代理监管多智能体协作架构与挑战
zerodep实证:LLM辅助标准库重写第三方库的性能与正确性评估
TimeSRL用语义RL调优LLM实现跨数据集时间序列行为建模
APEX自主策略探索解决自进化LLM Agent探索崩溃问题
TextReg正则化文本空间优化缓解提示分布过拟合
MEMTIER 三层记忆架构解决自主AI代理72小时运行记忆崩溃
GraphFlow提出基于图的工作流管理提升LLM-Agent服务效率
MIST 利用谱回归分析检测微调后门 DNNs
分层KV缓存架构实现量化注意力的运行时误差认证