模型提取攻击绕过单客户端防御假设,威胁军事C2系统
SeeTraceAct:基于可见性感知的跨实施例演示视频潜在规划
KITScenes发布多模态自动驾驶数据集:400米激光雷达与4D成像雷达
Vision Inference Former 维持多模态大模型视觉一致性
AAM多模态基础模型:统一人类注意力建模新范式
Any2Poster 发布八种输入源海报生成评估基准
Multi^2分层多智能体框架解决LLM长期决策目标漂移问题
Kapa.ai 详解图像索引方法以提升 RAG 检索效果
概率电路:快速且富有表现力的多字节预测
动态短卷积引入输入依赖滤波器改进Transformer
文生图模型对文本编码器信息的依赖低于预期
大语言模型微调安全措施应基于能力目标
LLM评审者自偏好偏差的量化与缓解方法
Pluto.jl 1.0正式发布:Julia 响应式交互笔记本
AURA:动作门控记忆实现机器人策略恒定VRAM推理
利用幻觉拒绝采样,大模型实现长文本可靠生成
WildRoadBench 提出无人机道路损伤视觉定位基准测试
大语言模型推理新知识还是抄袭?科学界两派叙事对立
研究揭示LLM自动评分系统面临提示注入攻击风险
无训练多概念LoRA组合:提示感知权重提升图像生成一致性
DriftSched:面向多租户GPU推理的运行时Token漂移自适应QoS调度
ChatHealthAI:对齐电子健康记录与大型语言模型的临床推理框架
VSCode漏洞可让攻击者一键窃取GitHub令牌
微软开源自适应评估框架,支持文本描述生成AI行为测试
研究揭示线性回归中思维链推理的渐近理论
GeoDrive-Bench 提出区域特定自动驾驶多模态推理评估基准
Together AI 发布 FlashAttention-4,Blackwell 上推理速度提升 1.3 倍
跨维智能登顶WorldArena,世界模型榜单易主
RLHF失败的系统性分类:奖励黑客、崩溃与评估者游戏
Kimi推出桌面端Kimi Work,通用型本地Agent自主拆解任务
Ultralytics YOLO26 统一实时端到端视觉模型发布
斯坦福研究:人工智能在法律分析中超越法学教授
SYNCRED-Bench:首个针对AI生成视觉虚假信息合成可信度的基准测试
PersistGS用可微物理实现4D高斯泼溅物体永久性
Cosmos 3全模态世界模型统一语言图像视频音频动作处理
SAIL:用大语言模型自动合成神经网络验证的健全抽象解释器
潜在扩散模型可扩散性系统研究:重建质量不等于生成能力
RogueMerge:模型合并中恶意任务向量实现统一鲁棒攻击
Anthropic中文叫什么?3种常见叫法一次说清
Anthropic中文叫什么?官方译名竟是这个
微软MAI模型编程失业vs AI替代:3个关键数据揭示真相
Anthropic中文谐音怎么读?3种常见读法对比
亲测OpenAI API Key 充值全流程,2026踩坑实录
微软暂停vibe coding怎么看?背后的深层原因与行业影响
微软Build 2026大会如何评价?这3个常见误解要当心
Flow Matching模型提出多实例图像编辑的断点转移方法
群对称性流匹配实现等变潜在对齐新方法
PointAction:用3D点作为通用动作表示解决机器人控制空间模糊问题
MAEPose 自监督时空学习实现毫米波视频人体姿态估计
噪声注入技术提升大语言模型幻觉检测效果