无需假分数网络的分布匹配蒸馏实现高效几步生成
WorldParticle:基于Transformer的统一粒子动力学模拟器
DeepSeek-V3-0324模型下载量达54万
LM Studio 最新测试版正式支持 MTP 推测解码加速
Starcoder2-3B代码生成模型发布
月之暗面推出Kimi-VL-A3B-Thinking多模态推理模型
谷歌AI遭操纵输出错误信息,悄然反击修复漏洞
月之暗面Kimi-K2-Thinking文本生成模型上线
MiniMax 发布视觉语言模型 MiniMax-VL-01,支持图文对话
DeepSeek-OCR-2 多模态模型发布,支持多语言图像文本识别
字节跳动 Ouro-2.6B 发布:2.6B 参数循环深度推理模型
MiniMax 开源多模态模型 MiniMax-VL-01 支持图文对话
BAAI 开源 bge-reasoner 嵌入模型 Qwen3 版
Mistral 发布 Codestral-Mamba 与 Mathstral,引入 Mamba 架构
NVIDIA发布Nemotron-3多模态推理模型,30B参数仅3B激活
昆仑万维开源SkyReels-V3-A2V-19B图像转视频模型
昆仑万维开源19B参数图生视频模型SkyReels-V3-A2V
Mistral v1.1.0 新增 Tekken 与 Mistral-Nemo 支持
Pixtral v1.4.0发布:Mistral模型新增视觉理解能力
阶跃星辰开源Step-3.5-Flash-Base文本生成模型
智源研究院发布Emu3.5-Image图文生成模型
Mistral AI 发布 Mistral Guidance,语法引导模型推理与工具调用
Mistral AI 发布 v1.1.0,支持 Tekken 与 Mistral-Nemo
Meta AI v0.2.0 版本正式支持 Llama 4
阶跃星辰发布Step-3.5-Flash-Base文本生成模型
BAAI发布Emu3.5-Image,实现图文到图像生成
Open-Sora v1.2.0 发布:新增视频压缩网络和Rectified-flow训练
Mistral 推出 Guidance:用 Lark 语法引导模型推理与工具调用
Mistral AI 发布 Pixtral 模型,支持图像理解
xAI Grok-2模型上线Hugging Face,下载量已超4.2万
月之暗面发布Kimi-VL-A3B-Thinking多模态推理模型
字节跳动发布Dolphin-v2多模态文档解析模型
概念中心学习无需硬负样本提升对比模型组合性并保持零样本能力
搜索自博弈:无监督驱动智能体能力边界拓展
高阶朗之万动力学降低扩散模型记忆化风险
LLM驱动MCP物理工作流发现胰岛素递送聚合物
Kimi K25/DSR1模型新增TOKENSPEED_MLA注意力后端加速
Open-Sora 1.0.0 开源发布,高质量视频生成工具开放
Qwen-Image-VAE-2.0 发布:高压缩VAE以全局跳跃连接与合成渲染提升重建保真度
基于树广播的层次语言模型实现可预测缩放定律与推理收益
Open-Sora V1.3发布 升级视频压缩与ST-DiT架构提升生成质量
Open-Sora v1.2.0发布:新增视频压缩网络与整流流训练
RealICU基准:检验大模型对长上下文ICU数据的理解能力
DeepMind发布Gemma 4最强开源模型及AlphaEvolve智能体
MLA注意力后端v0.21.0rc3新增TOKENSPEED_MLA加速DSR1/Kimi K25
RealICU:超越行为模仿的ICU长上下文大模型理解基准
语言模型规模达3.5B参数时推理与真实性从对抗转向协同
Open-Sora 1.0正式版发布:开源高质量视频生成模型面向全民
通义千问Qwen-Image-VAE-2.0高压缩VAE改进重建保真与扩散性
Open-Sora V1.3发布:升级视频压缩与ST-DiT架构,强化图生视频