Powered by站群

开云app下载 股价暴涨32%!GLM-5登顶全球开源第一,25分钟一镜到底搓出完整系统

发布日期:2026-02-13 13:19    点击次数:185

开云app下载 股价暴涨32%!GLM-5登顶全球开源第一,25分钟一镜到底搓出完整系统

{jz:field.toptypename/}

新智元报谈

裁剪:好困 定慧

【新智元导读】Vibe Coding时期宣告破除!2026年开端,智谱GLM-5颤动空降,以「智能体工程」重塑游戏规定。用Claude七分之一的地板价,国产模子正面硬刚Opus 4.5!

2月7日深夜,一个代号「Pony Alpha」的高明模子暗暗上线。

随后,外网炸了。

扔进去一段改了一天齐没贬责的「屎山代码」,它顺遂重构了架构;输入一段粗陋的指示,它吐出一个包含35个电台、UI丝滑的完整Web App。

这种极致的工程能力,告成印证了 Andrej Karpathy 几天前的断言:

Vibe Coding仍是成为畴前,新的游戏规定只消一个名字——

Agentic Engineering(智能体工程)。

紧接着,Opus 4.6与GPT-5.3-Codex 次日深夜「撞车」上线,全篇只谈「长程任务、系统工程」。

就在通盘东谈主以为这又是闭源巨头的独角戏时,Pony Alpha的答案揭晓——

它是GLM-5。

全球第一个站上这条赛谈,和硅谷巨头在系统级工程能力上正面硬刚的开源模子。

答案揭晓后,智谱股价告成暴涨32%!

全球开源第一!

{jz:field.toptypename/}

国产模子的「Opus时刻」

在着实上手之后,咱们只消一个感受:确实太强了!

要是说Claude Opus代表了闭源模子的巅峰,那么GLM-5的发布,无疑记号着国产开源模子迎来了属于我方的「Opus时刻」。

在巨擘榜单Artificial Analysis中,GLM-5位居全球第四、开源第一

就在发布当日,10余款由开采者基于GLM-5「手搓」的游戏和器用已同步展出并提供体验,后续这些运用也将接续登陆各大运用商店。

这意味着,GLM-5正将「AI编程」回荡为「AI寄托」,着实罢了了坐蓐力器用向买卖居品的无缝率先。

体验地址:showcase.z.ai

比如这个名为「Pookie World」的款式。

就是由GLM-5驱动的数字平行天下,通过多层生物-脸色框架赋予自主智能体真实的叙事完整性与生命动机。

还有复刻版「我的天下」,这个效用和玩法简直和Minecraft一模相同。

咱们也使用Claude Code手脚外壳,告成接入GLM-5的API进行了多维度的实测。

不管是Next.js全栈款式,如故MacOS/iOS原生运用,它齐能罢了从需求分析、架构蓄意到代码编写、端到端调试的全历程闭环。

作念了N个款式,冥冥之中有一种感受:

某种程度上,GLM-5八成是一个能蜕变行业形式的模子。

· 复杂逻辑挑战:「无尽常识六合」

要是你以为写个网页很粗陋,那试着让AI贬责一个对JSON体式条目极严、且波及动态渲染的「无尽流」款式。

就拿咱们着手测试的「无尽常识六合」来说。

这是一个典型的复杂前后端区别款式,波及React Flow动态渲染、Next.js API路由蓄意,以及极其严格的JSON体式输出条目。

对此,GLM-5的确认号称惊艳。

它不仅一次性完成了通盘这个词款式文献结构,更让东谈主惊喜的是它的debug逻辑。

在碰到一个渲染bug时,咱们只说了一句「页面如故一派黑,启动化时莫得出现第一个内容……」

GLM-5坐窝定位到是加载时机的问题,并迅速给出了修正决议。

完整的指示词如下:

- 难点攻克:让模子输出踏实的JSON体式(这是测试模子指示驯顺能力的绝佳场景)。

· 更复杂的中台款式,11分钟搭建完毕

接下来加浩劫度,让它开采一个名为「Soul Mirror」的脸色分析运用。

需求分为两步:

逻辑蓄意:饰演荣格脸色学群众,输出包含分析文本和视觉参数的JSON。

Step 2

前端罢了:把柄参数动态渲染SVG,生成塔罗牌作风的卡片。

4.增多一个“保存为图片”的按钮(使用html-to-image库)。

通盘这个词过程,它展现出的团结力,每每会让东谈主怀疑是不是在用Opus 4.5。

然则看了一眼,如实就是GLM-5。

· 25分钟一镜到底,着实的Agentic Coding

为了更进一步测试GLM-5的能力,咱们条目它不使用API,竣工模拟真实用户,来制作一个X平台的监控系统。

限度:25分钟,一镜到底。

完整录屏如下:

不错看到,GLM-5会在运行中自主调用各式器用Agent,策动任务、拆解才调、碰到报错我方查文档修正。

这种永恒间保管逻辑连贯性的能力,是以前开源模子不敢设想的。

完成后,一句话即可让GLM-5自动运行款式

· 看图写APP,这回复度确实服了

终末,咱们又把一张OpenClaw之父开源项办法截图(一个AI额度统计器用),告成丢给GLM-5:

照这个给我作念一个MacOS App。

没一会,它确实「复刻」了一个同款居品出来。

固然数据是Mock的,但UI布局、交互逻辑简直齐备复刻。

这不仅是视觉团结能力,更是将视觉回荡为SwiftUI代码的工程落地能力。

大神手搓:1天复刻「丐版Cursor」

为了考据GLM-5的工程极限,一位资深开采者决定玩把大的:

从零手搓一个带桌面UI的AI编程助手——GLMLIFE。

这十分于要作念一个简便版的Cursor。

任务扔给GLM-5后,它莫得上来就狂写代码,而是先甩出了一份专科的架构蓄意文档(PLAN.md),并作念出了极其熟练的时候选型:

告成接收了Monorepo架构,将款式精确拆解为三个中枢包。

Core:谨慎Agent中枢引擎与LLM适配;

CLI:处理敕令行交互;

Desktop:基于Electron + React 18的桌面主圭臬。

从Zustand景色经管到Tailwind神志决议,再到复杂的IPC程度通讯,GLM-5像个带了十年团队的时候总监,把时候选型安排得清皎白白。

开采者正本以为要花三天建设环境,限度仅用一天就跑通了从环境搭建、中枢逻辑罢了到Electron打包的全历程。

大开GLMLIFE的那一刻,你很难征服这是AI在一天内「架构」出来的产物。

GLMLIFE制作迷你钢琴罢了过程

为什么它能成为「开源界的Opus」?

放眼全球,Claude Opus 4.6和GPT-5.3-Codex之是以备受追捧,开云app官方下载是因为它们具备极强的「架构」能力。

Opus 4.6的暴力好意思学:16个AI分身自主单干,耗时两周,从零构建了一个包含10万行代码的Rust编译器,通过了99%的GCC压力测试。

GPT-5.3的自我创造:它是OpenAI第一个「参与自身创造」的模子,在「降生」前就已介入检修历程和集群部署。

相关词,这一切齐有一个致命的前提:它们不仅闭源,而且娴雅。

此时此刻,GLM-5的发布,即是中国开源大模子对Agentic时期的一次暴力破局。

它告成盯着闭源巨头最不想铁心的范畴——系统级工程能力,作念了一次「平替式」的迫切。

1. 新晋「后端架构师」

智谱团队异常澄莹,开源界不缺能写Python剧本的模子,缺的是能处理脏活、累活、大活的模子。

GLM-5在检修中大幅强化了后端架构蓄意、复杂算法罢了和顽强Bug诞生的权重,况兼还罢了了极强的自我反念念机制。

在编译失败时,它会像一个熟练的工程师相同,自主分析日记、定位根因、修改代码、再行编译,直到系统跑通。

2. 既然是干活,就要算账

并列Opus的性能,和开源的权重,让GLM-5从某种程度上撼动了Anthropic和OpenAI构建起的围墙花坛。

腹地部署:它不仅不错在竣工终止的内网中运行,况兼还能针对公司的独有框架进行微调,成为最懂自家代码的专员。

资本可控:用户不错用虚耗级显卡集群跑起一个强力的Coding Agent,毋庸每运行一次测试齐要在意钱。

屠榜SOTA

GLM-5的此次进化,只可用两个字描绘:暴力。

既然是面向复杂系统工程蓄意的基座模子,那范畴详情要拉满。

参数目从355B(激活32B)连结干到了744B(激活40B),预检修数据也从23T堆到了28.5T。

除了「大」,还得「省」。

人所共知,Agent跑起来最烧钱的就是Token。

为了解决这个痛点,GLM-5初度集成了DeepSeek Sparse Attention(零散妥当力)机制。

这让它在处理超长潦倒文时,不仅能保握「无损」的记念力,还能大幅裁减部署资本。

还有个更狠的「黑科技」——全新的异步强化学习框架Slime。

和谐大范畴强化学习,让模子不再是「一次性器用」,而是能在长跑中越跑越智谋的「长程选手」。

至于跑分,更是硬核:

代码能力

SWE-bench Verified告成冲到77.8分,Terminal Bench 2.0一举拿下56.2分,齐是开源第一。这个收货不仅超了Gemini 3.0 Pro,更是告成贴脸Claude Opus 4.5。

Agent能力

BrowseComp(联网检索)、MCP-Atlas(器用调用)和τ²-Bench(复杂策动),全线霸榜开源第一。

最原理的是Vending Bench 2(自动售货机策动测试)。

在这个测试中,模子得竣工靠我方策动一年售货机。

您猜奈何着,GLM-5到年底竟然赚了4432好意思元,这水平齐快赶上Opus 4.5了。

在开采者最珍视的里面Claude Code评估聚合中,GLM-5在前端、后端、长程任务等编程开采任务上权贵超越上一代的GLM-4.7(平均增幅卓著20%)。

真实使用体感仍是面临Opus 4.5。

用AI造AI

天然,GLM-5的贪念不啻于模子,更在于重构咱们手里的编程器用。

全球爆火的OpenClaw让寰球看到了AI操作电脑的潜能。

此次,智谱也推出了AutoGLM版块的OpenClaw。

在用原版时,光环境建设就需要折腾半天,当今官网一键部署。

想要个7x24小时帮你盯着推特、整理资讯、以至写剧本的「数字实习生」?点一下就有了。

同期发布的还有Z Code——

竣工基于GLM-5能力诞生的新一代开采器用。

在Z Code里,你只管提需求,模子会自动拆奉命务,以至拉起一堆Agent并发干活:写代码、跑敕令、Debug、预览,终末连Git提交齐帮你贬责。

以至,你还不错用手机良友指示桌面端的Agent干活。

值得一提的是,就像OpenAI用Codex写出了Codex,Z Code本人,亦然GLM模子全程参与开采出来的。

国产算力的告捷

在GLM引爆全球流量、Agent需求激增的背后,一群「无名勇士」正默然撑握着海量的计算负荷。

为了确保每一滑代码、每一次 Agent 策动齐能踏实输出,GLM-5仍是真切国产算力的「腹地」,完成了与华为昇腾、摩尔线程、寒武纪、昆仑芯、沐曦、燧原、海光等主流平台的深度适配。

通过底层算子级的紧密化优化,让GLM-5在国产芯片集群上也能跑出「高浑沌、低蔓延」的满血确认。

这意味着,咱们不仅有了顶级的模子,还不被卡脖子。

结语

2026年的春天,编程大模子终于脱去了稚气。

Karpathy所谓的「Agentic Engineering」,实质上是对AI提议了一种更严苛的「口试条目」:

以前(Vibe Coding):只消你会写漂亮的HTML,我就录用你。

当今(Agentic Coding):你需要懂Linux内核,懂500个微做事之间的调用关系,懂如安在不炸掉线上的前提下重构代码,还要能我方策动任务、我方修Bug。

GLM-5并不齐备。

但在「构建复杂系统」这一中枢命题上,它是刻下开源界惟一能接住这波「Agentic海浪」的选手。

Vibe Coding仍是终局了。

别再问AI「能不成帮我写个网页」了。那是2025年的事情。

当今,试试问它:「能不成帮我重构这个高并发系统的中枢模块?」

GLM-5,Ready to Build!

彩蛋

GLM-5仍是纳入Max用户套餐,Pro将尽快在5天内支握!

况兼刚刚智谱晓谕加价,本年的Token注定是要加价的!

速即去体验吧!

官方API接入

·BigModel洞开平台:

https://docs.bigmodel.cn/cn/guide/models/text/glm-5

·Z.ai:

https://docs.z.ai/guides/llm/glm-5

·OpenClaw接入文档:

https://docs.bigmodel.cn/cn/coding-plan/tool/openclaw

开源聚首

·GitHub:

https://github.com/zai-org/GLM-5

·Hugging Face:

https://huggingface.co/zai-org/GLM-5

·ModelScope:

https://modelscope.cn/models/ZhipuAI/GLM-5