老金的分享

GLM-5 真够顶的：超24小时自己跑代码，700次工具调用、800次切上下文

2026年2月13日

GLM-5 能够自主连续运行代码超过24小时，标志着开源大模型从助手向独立工程师的质变

文章主要介绍了开源大模型 GLM-5 的发布及其在长任务处理和代码生成方面的突破性能力。

核心要点

技术突破

GLM-5 展现了惊人的长任务处理能力：

自主连续运行代码超过 24小时
期间进行了 700次工具调用
完成 800次上下文切换
成功从零用 JavaScript 编写出一个 GBA（Game Boy Advance）模拟器

应用实例

除了模拟器，GLM-5 还能胜任多种全栈任务：

制作具有设计感的电商网站
手搓 3D 版可交互的《我的世界》

行业影响

GLM-5 标志着开源大模型从"助手"向"独立工程师"的质变：

用户只需给定目标，AI 即可自主完成调试和开发
可能对 SaaS 行业造成冲击，引发市场对 AI 替代传统软件服务的担忧

开源意义

GLM-5 将强大的长任务能力交到了开发者手中
打破了闭源巨头的特权
智谱公司从 GLM-4.5 版本开始深耕 AI 编程
模型已在 GitHub、Hugging Face 和 ModelScope 等平台发布

总结

GLM-5 的发布展示了开源大模型在长时间自主编程任务上的重大突破，为 AI 辅助开发开启了新的可能性。