AWS发布自主安全渗透测试与DevOps运维前沿代理
银轮股份数据中心冷却模块已量产,配套大马力发电机组
德福科技拟投资31亿元建设年产5万吨高端AI电子电路铜箔项目
IPIBench:多模态大模型连续流交互式主动智能评估基准
DETR-ViP 以鲁棒判别性视觉提示实现开放词汇目标检测
PATE-TabTransGAN:差分隐私下Transformer合成表格数据生成
状态推理:多智能体工具调用从全量重算转为增量计算
大模型知识蒸馏中混合硬标签与软标签的优化机制
密码学注册表溯源系统防御AI包依赖混淆攻击
sub-3B语言模型的结构化输出约束税与正确性权衡
Maat:专为竞争保护设计的智能法律研究助手
OMD-GraphRAG:本体引导提取与多维聚类融合增强图RAG系统
RAG上下文冲突时如何自知?CDD方法诊断知识偏移
RAG读者模型出错根源:语义竞争而非上下文长度
后训练使大语言模型更偏离人类行为模式
LLM在伦理决策中系统性忽略宗教视角的遗漏偏见
CyberMaskQA:面向网络安全问答的隐私感知大模型评估基准
Agent-ToM:用心智理论推理监控自主LLM代理的隐蔽恶意行为
多模态大模型结构认知过载致安全失效,StructBreak揭示新漏洞
JuICE基准:评估大模型法官识别文化错误的能力
OpenClaw智能体安全:基础、攻击与防御机制
任务复杂性决定AI是平等器还是放大器:混合智能系统研究
MMGS:基于多视图排名与最优传输的10倍压缩3DGS方法
When2Tool基准揭示LLM代理不必要调用工具
WorldParticle:基于Transformer的统一粒子物理模拟器
TADA激活导向技术实现音频扩散模型细粒度属性控制
SpecX大规模多模态光谱基准发布,囊括170万分子与七种光谱
Jina Embeddings v5 Omni:几何保持的多模态嵌入模型
HuggingFace PEFT 0.16.0 新增 LoRA-FA、RandLoRA 等优化方法
高阶朗之万动力学用于减少扩散模型训练样本记忆
JAXenstein:加速第一人称环境基准测试
HuggingFace PEFT 0.18.0 发布:新增 RoAd、ALoRA 等多项 LoRA 变体
Agentic Discovery of Cryomicroneedle Formulations
CODA用GEMM-Epilogue重写Transformer块缓解内存瓶颈
Lens自适应相机传感器从模型视角捕获高质量图像提升视觉模型性能
Agentic AI系统被论证为通往AGI的必然路径
域伪装注入攻击使Llama 3.1检测率从93.8%暴跌至9.7%
重复小数据集训练因采样偏差实现更快AI学习
Soft Learning:非负最小二乘交叉验证组合异质专家
LLM缺失人类过滤能力,99%检索成功率形同随机选择——Bits方案
Query-Aware Flow Diffusion for Graph-Based RAG with Retrieval Guarantees
Hybrid-LoRA: Bridging Full Fine-Tuning and Low-Rank Adaptation for Post-Training
LLM Agent可编程运行时技能提升效率与精度
EngiAI 发布多智能体框架与基准,评估 LLM 工程设计能力
ResearchArena测试Claude、Codex、Kimi自动研究:论文可生成但质量存疑
arXiv研究:八种主流大模型均现极端自我偏好
自我对弈SWE-RL (SSR) 推进超级智能软件智能体训练
CHI-Bench评测AI代理自动化端到端多角色医疗工作流能力
GraphPINE:基于先验知识的图神经网络实现可解释药物反应预测
HuggingFace 推出分块交叉熵损失函数,SFT 显存节省达 50%