字节跳动开源Lynx图像转视频模型

作者：袖梨 2026-06-01

字节跳动开源Lynx图像转视频模型，这是一款基于Wan2.1-T2V-14B基础模型微调而来的图像转视频工具，目前已在Hugging Face平台发布。该模型获得了138个点赞，采用Apache-2.0开源协议，并附带一篇arXiv论文（编号2509.15496）。作为AI行业的重要动态，Lynx的出现意味着视频生成技术又添新成员。

Lynx究竟能做什么？它主打图像到视频的生成能力，并特别强调身份保持（identity-preservation）特性。简单来说，你给它一张人物或场景的静态图片，它能基于这张图生成一段连贯的视频内容，同时保留原图中主体的关键特征。这不正是视频创作者们梦寐以求的功能吗？

技术基础与许可协议还是挺明确的。Lynx以Wan-AI公司开发的Wan2.1-T2V-14B模型为基座，说明字节跳动团队是在已有的大规模视频生成模型上做了定向微调。模型权重完全开源，采用Apache-2.0许可，开发者可以自由下载、使用甚至修改，这确实降低了视频生成技术的入门门槛。

标签透露了更多细节，模型中包含了“personalized-video”（个性化视频）和“image-to-video”等核心标签。从这些标签来看，Lynx的目标不是简单生成随机视频，而是要让用户能够控制视频内容与输入图像的一致性。这就好比咱们用一张老照片，想让其中的人物“活”起来，Lynx很可能就是干这个的。