智源研究院发布基于Qwen3-0.6B微调的文生图模型URSA

作者：袖梨 2026-06-02

智源研究院发布基于Qwen3-0.6B微调的文生图模型URSA，目前已在Hugging Face平台开源。该模型以Apache-2.0许可发布，标签显示其采用diffusers框架和safetensors安全张量格式，并配备专属的URSAPipeline管线。截至检索，模型下载量为7次，获得6个点赞，社区反响正在积累中。

URSA的基座模型是Qwen系列中的小参数版本——Qwen3-0.6B。智源研究院将其微调为文生图任务专用，算是对“小模型能否玩转文生图”的一次挺认真的探索。说实话，市面上大多数文生图模型动辄几十亿参数，而URSA只有6亿参数左右，这确实挺让人好奇的：它到底能生成什么样的图片呢？

从技术栈看，模型同时支持diffusers和safetensors，意味着开发者可以直接用熟悉的Hugging Face调用方式快速上手。论文编号arxiv:2510.24717也已收录，说明智源团队不是光发模型就完事——他们把技术细节也公开了，咱们可以去翻翻这篇论文，看看微调策略和训练数据是怎么处理的。

为什么智源要拿这么小的模型做文生图？原因其实很简单：降低部署门槛。很多个人开发者或小公司没那么多GPU，6B模型可以在单卡甚至边缘设备上跑起来。URSA的出现，可以说给了社区一个“轻量级文生图”的新选择。它是不是能跟那些大模型掰手腕呢？这要看后续的评测和用户反馈了。