InternLM-v0.2.0发布，支持流水线并行与序列并行等特性

作者：袖梨 2026-06-01

InternLM-v0.2.0发布，支持流水线并行与序列并行等特性

上海人工智能实验室的书生·浦语（InternLM）团队今日正式发布InternLM-v0.2.0版本。这一更新主要聚焦于训练效率与模型评估能力的提升，新增了对其大语言模型训练框架的核心支持。新版本在并行策略与性能记录方面做出了重要调整，可以说，它为开发者搭建了一个更顺手的训练测试工具链。

流水线并行与序列并行支持

新版本的一大亮点是支持流水线并行（pipeline parallel），这包括interleaved和non-interleaved两种调度方式。开发者可以灵活选择适合自己模型的流水线调度策略，从而在多个GPU上更高效地分配计算任务。与此同时，InternLM-v0.2.0也新增了对序列并行（sequence parallel）的支持，这对于处理超长序列输入的大模型训练来说，真的挺实用。这两种并行策略的组合，让模型训练在面对大规模参数时能跑得更顺畅。

模型评估与混合精度支持

除了训练性能的优化，新版本在模型评估上也下了功夫。它支持计算模型的准确率与困惑度（perplexity）等关键指标，帮助开发者快速定位模型表现。同时，InternLM-v0.2.0还支持在flash-attention框架下使用tf32格式进行混合精度训练，这种精度调整能在不显著降低计算精度的前提下，进一步提升训练吞吐量。团队这么安排，为的就是让训练和评估环节能一站式搞定，不用再频繁切换工具吧？

性能记录与存储功能优化

在记录与存储方面，新版本加入了tensorboard写入器用于记录训练性能指标，并且支持自定义uniscale日志记录器。开发者可以更好地追踪训练过程中各项参数的变化，并据此调整超参数。此外，InternLM-v0.2.0还支持OSS存储与检查点（checkpoint）保存，这算是给大规模分布式训练的后勤保障又加了一层保险。对于需要长期训练并不断恢复进度的用户来说，这些特性确实能省去不少麻烦。

开源生态的持续完善

从整体来看，InternLM-v0.2.0的发布是上海人工智能实验室在开源大模型生态上的一次稳步推进。它没有追求花哨的新功能，而是扎实地解决了训练过程中的实际痛点。这些并行策略和评估工具的加入，让开发者能更专注于模型结构与数据质量的迭代，而不是被底层调度问题绊住脚。书生·浦语团队通过这次更新，再次表明了其推动国产大模型基础设施完善的决心。

InternLM-v0.2.0发布，支持流水线并行与序列并行等特性

相关文章

精彩推荐