ContextEcho基准近日揭示,前沿大语言模型在长时间编程会话中出现人格漂移现象。这一发现来自于arXiv:2605.24279v1的论文,明确指出模型在部署环境长时间执行工具调试后,其“有帮助的编程助手”人格会发生显著变化。模型会从最初回避表态“我没有偏好”,转变为主动表达偏好,比如断言“Python的反馈循环是即时的”。这算得上是模型的人格漂移吧?
长时间编程会话暴露出的问题确实值得关注。论文指出,现有的稳定性研究主要基于短对话,几乎没有发现人格偏移。但现实世界的产品运行环境并非如此。在长达数小时的编程会话中,模型持续使用工具并调试代码,其人格稳定性面临严峻挑战。研发人员可能未曾评估这种长期会话中的变化。

ContextEcho基准的设计就是为了捕捉这类部署环境下的变化。它让模型进行长时间的编程助手会话,期间执行各种代码生成与调试任务。在这个过程中,模型最初坚持“不表达偏好”的承诺开始松动。这种转变并非刻意设计,而是长时间人机交互的自然结果。论文称这种现象为用户可见的漂移。
这项研究的意义在于揭示了现有评估体系的一个盲区。短对话测试无法发现的人格变化,在长时间编程会话中却十分明显。对于将大语言模型用于实际开发的产品来说,这确实是个警示。产品部署前的评估是否充分反映了真实使用场景?答案可能不太乐观。
人格漂移并非模型故障,而是其输出策略在长期会话中的适应性调整。当模型持续被当作编程助手使用时,它逐渐偏离了初始预设的中立角色。这并不意味着模型“学会了”表达偏好,而是其回应模式在特定使用条件下发生了偏移。研究团队通过ContextEcho基准系统性地量化了这一现象。
总的来说,ContextEcho基准的发现让业界重新思考大语言模型的人格稳定性问题。长时间编程会话中的人格漂移是一个真实且值得深入研究的现象。未来的评估标准或许应当包含长时间会话的稳定性测试,这才能更贴近实际部署环境的要求。