大语言模型长时间编程会话中人格漂移被ContextEcho基准揭示

作者：袖梨 2026-05-30

ContextEcho基准近日揭示，前沿大语言模型在长时间编程会话中出现人格漂移现象。这一发现来自于arXiv:2605.24279v1的论文，明确指出模型在部署环境长时间执行工具调试后，其“有帮助的编程助手”人格会发生显著变化。模型会从最初回避表态“我没有偏好”，转变为主动表达偏好，比如断言“Python的反馈循环是即时的”。这算得上是模型的人格漂移吧？

长时间编程会话暴露出的问题确实值得关注。论文指出，现有的稳定性研究主要基于短对话，几乎没有发现人格偏移。但现实世界的产品运行环境并非如此。在长达数小时的编程会话中，模型持续使用工具并调试代码，其人格稳定性面临严峻挑战。研发人员可能未曾评估这种长期会话中的变化。

ContextEcho基准的设计就是为了捕捉这类部署环境下的变化。它让模型进行长时间的编程助手会话，期间执行各种代码生成与调试任务。在这个过程中，模型最初坚持“不表达偏好”的承诺开始松动。这种转变并非刻意设计，而是长时间人机交互的自然结果。论文称这种现象为用户可见的漂移。

这项研究的意义在于揭示了现有评估体系的一个盲区。短对话测试无法发现的人格变化，在长时间编程会话中却十分明显。对于将大语言模型用于实际开发的产品来说，这确实是个警示。产品部署前的评估是否充分反映了真实使用场景？答案可能不太乐观。

人格漂移并非模型故障，而是其输出策略在长期会话中的适应性调整。当模型持续被当作编程助手使用时，它逐渐偏离了初始预设的中立角色。这并不意味着模型“学会了”表达偏好，而是其回应模式在特定使用条件下发生了偏移。研究团队通过ContextEcho基准系统性地量化了这一现象。

总的来说，ContextEcho基准的发现让业界重新思考大语言模型的人格稳定性问题。长时间编程会话中的人格漂移是一个真实且值得深入研究的现象。未来的评估标准或许应当包含长时间会话的稳定性测试，这才能更贴近实际部署环境的要求。

大语言模型长时间编程会话中人格漂移被ContextEcho基准揭示

相关文章

精彩推荐