返回转载

GLM-5 真够顶的:超24小时自己跑代码,700次工具调用、800次切上下文

2026年2月13日

GLM-5 能够自主连续运行代码超过24小时,标志着开源大模型从助手向独立工程师的质变


原文链接

文章主要介绍了开源大模型 GLM-5 的发布及其在长任务处理和代码生成方面的突破性能力。


核心要点

技术突破

GLM-5 展现了惊人的长任务处理能力:

  • 自主连续运行代码超过 24小时
  • 期间进行了 700次工具调用
  • 完成 800次上下文切换
  • 成功从零用 JavaScript 编写出一个 GBA(Game Boy Advance)模拟器

应用实例

除了模拟器,GLM-5 还能胜任多种全栈任务:

  • 制作具有设计感的电商网站
  • 手搓 3D 版可交互的《我的世界》

行业影响

GLM-5 标志着开源大模型从"助手"向"独立工程师"的质变:

  • 用户只需给定目标,AI 即可自主完成调试和开发
  • 可能对 SaaS 行业造成冲击,引发市场对 AI 替代传统软件服务的担忧

开源意义

  • GLM-5 将强大的长任务能力交到了开发者手中
  • 打破了闭源巨头的特权
  • 智谱公司从 GLM-4.5 版本开始深耕 AI 编程
  • 模型已在 GitHub、Hugging Face 和 ModelScope 等平台发布

总结

GLM-5 的发布展示了开源大模型在长时间自主编程任务上的重大突破,为 AI 辅助开发开启了新的可能性。