昨晚 12 点多,正准备睡觉,结果被朋友圈里一条"GLM-4.7吊打Sonnet4.5"的消息炸醒了。

我立马去官网确认了一下,确实是真的。距离 GLM-4.6 发布也才3个月,这迭代速度有点猛啊。

我翻了翻官方给的 benchmark 数据,好家伙,在代码生成、多轮对话、长文本理解这几个维度上,GLM-4.7 的分数确实追上来了,有些指标甚至还略高一点。

  • 在HLE复杂任务测试中,GLM-4.7 得分 42.8,大幅领先 Claude,优势高达约34%,这是所有测试中差距最显著的项目。

  • 在 BrowseComp 网页交互测试中,GLM-4.7 达到 67.5 分,明显超过 Claude 的 51.4 分。

而且,在权威的大模型评测榜单 Artificial Analysis Intelligence Index 中,GLM-4.7 凭借 68 分的综合得分,在一众国际顶尖模型中脱颖而出,强势位列全球第六,国产排第一,实力不凡。

行吧,既然睡不着了,那就连夜测测看,到底是不是真有料。

一、z.ai 在线体验


这次,GLM-4.7 支持两种使用方式:一是 z.ai 在线体验,适合快速验证,支持全栈开发;二是 Claude Code + GLM-4.7 API,适合深度开发和迭代。

我们先来看 z.ai 在线体验,打开网页:https://chat.z.ai/

测试一:AI PPT


目前市面上能够生成 PPT 的大模型不多,即便有些模型具备此功能,生成的内容往往存在布局混乱、美学欠佳等问题,需要大量后期调整。GLM-4.7 在这方面表现出明显优势。

例如,我们选择 AI PPT 功能,让它给我们生成一个海南旅游攻略的 PPT:

GLM-4.7 会花几分钟的时间全网搜索,然后深度思考,将素材汇总并智能生成一份高质量的 PPT。

可以看到生成的 PPT 效果不错,图文并茂,亮点也突出了。重点是全程不需要我们输入任何提示,也不需要排版,一份效果显著的 PPT 就做好了!

同时,生成的 PPT 还支持在线修改功能,可以替换文字和图片。

最后,直接点击分享,即可下载为 PDF 或 PPT 格式!

最近谷歌的 NotebookLM 很火,但是生成的 PPT 中文字体会出现变形。相比之下,GLM-4.7 作为国产模型对中文支持更好,不会出现字体变形或排版混乱问题。它能准确理解中文语境和表达习惯,在中文字体、标点符号、排版美学等方面都更符合国内用户需求。

二、Claude Code + GLM-4.7 API


对于需要深度迭代和产品优化的场景,我建议选择 Claude Code 等专业编程工具来配合使用 GLM-4.7。

打开网页:https://www.bigmodel.cn/

另外值得一提的是,智谱的定价策略相当实惠,老用户之前购买的套餐可以无缝升级体验最新的 4.7 模型,无需追加任何费用。

如何在 Claude Code 中配置 GLM4.7?


首先,进入 GLM-4.7 官网:https://www.bigmodel.cn/。

注册登录后,进入控制台,点击“API Key->创建新的 API Key”,生成自己专属的 API Key(后续配置需要使用)。

然后,我们需要在本地安装 Claude Code。详细步骤可以看我之前分享的文章《全网疯传的 Claude Code,3000 字保姆级教程 !

安装成功后,打开~/.claude/settings.json文件,设置以下内容:

{    "env": {        "ANTHROPIC_AUTH_TOKEN": "你的 API key",        "ANTHROPIC_BASE_URL": "https://open.bigmodel.cn/api/anthropic",        "ANTHROPIC_DEFAULT_HAIKU_MODEL": "glm-4.5-air",        "ANTHROPIC_DEFAULT_SONNET_MODEL": "glm-4.7",        "ANTHROPIC_DEFAULT_OPUS_MODEL": "glm-4.7",        "API_TIMEOUT_MS": "3000000"    }}

在 json 配置文件中,我们直接指定了 Claude Code 调用的是 GLM-4.7 模型。

接着,打开 Git Bash,输入 Claude 命令,进入 Claude Code 界面:

输入“/status”,如果显示 Model 是 glm-4.7 就说明配置好了。

我们可以先提问“你是什么模型?”来验证一下:

好了,GLM-4.7 就已经在 Claude Code 中设置好了!就能在 Claude Code 中调用 GLM-4.7 开始编程工作了。

测试二:开发个人技术博客网站


之前我用 AI 做过一个个人网站,但说实话,AI 味儿太重了:

  • 满屏的 emoji

  • 千篇一律的蓝紫渐变色

  • 布局中规中矩,毫无特色

这次我想让 GLM-4.7 帮我做个有点极客范儿的技术博客,要求是:

  • 暗色主题为主,但不能太压抑

  • 要有点赛博朋克的感觉

  • 代码展示区域要炫酷点

我直接给它提了需求,没给任何参考模板。

整个过程不需要我们参与,一切交给 GLM-4.7 就行,我们需要做的就是泡杯咖啡,等最终的成果就行。

大概几分钟的时间,GLM-4.7 成功生成了一个技术博客网站。本地同步生成了 .html、.js、.css 文件。

打开 index.html,看看效果:

效果还可以!基本满足我的需求了。关键是全程不需要我们干什么,直接放心地交给 GLM-4.7 就可以了!

测试三:创建 3D 版《我的世界》


为了真正测试 GLM-4.7 的代码生成能力,我们不打算做贪吃蛇或扫雷这类入门级小游戏,而是直接挑战一个高难度项目:创建一个 3D 版的《我的世界》游戏。

这个任务涉及3D渲染、方块生成系统、玩家交互、地形算法等多个复杂模块,对大模型的架构设计能力、图形编程理解和代码组织能力都是一次全面考验。接下来,让我们看看 GLM-4.7 能否完成这个挑战。

我直接告诉它:

做一个像素风格的 3D 体素游戏:类似《我的世界》的方块世界,支持 WASD 移动,鼠标控制视角,左键破坏方块,右键放置方块,支持跳跃和重力,可以切换不同类型的方块(草地、石头、木头)。

制作完成之后,实际体验一下:

GLM-4.7 的表现让我印象深刻。

打开页面直接进入第一人称视角,初始地面已铺好草地。操作体验非常流畅:WASD 移动、空格跳跃、鼠标控制 360 度视角、左键破坏方块、右键放置方块、数字键切换草地/石头/木头等不同材质。游戏逻辑完整且没有遇到任何 bug。

查看代码发现,Three.js 的场景配置很专业,体素网格优化保证了性能,射线投射检测鼠标点击的实现也很标准。这个 3D 游戏的复杂度远超普通小游戏,GLM-4.7 能一次性完成确实展现了强大的代码生成能力。

测试四:写个实用工具:Markdown 编辑器


玩游戏测完了,我想看看它在实用工具开发上的表现。作为一个经常写文档的人,我想要一个功能丰富的 Markdown 编辑器:实时预览、支持常用 Markdown 语法高亮、工具栏快捷插入(标题、加粗、列表等)、支持导出 HTML 和 PDF、支持目录自动生成、支持暗色模式切换。

这种工具类应用,考验的是对用户体验的理解和细节处理能力。

GLM-4.7 生成的 Markdown 编辑器采用左右分屏布局,左边是 Monaco Editor 编辑区,右边是实时预览区。

使用体验很流畅,输入时有语法高亮和自动补全,预览几乎零延迟更新。插入代码块会自动进行语法高亮,目录根据标题自动生成并支持跳转,导出的 HTML 保留完整样式可直接发布。

细节也做得不错:暗色模式配色协调,支持 Ctrl+S 保存到 LocalStorage 防止内容丢失,还有字数统计和全屏模式。这个编辑器比 Typora 轻量很多,我打算直接用起来。

三、实测总结:进步确实明显


测了一晚上加一个上午,几个项目下来,我的真实感受是:GLM-4.7 确实比 4.6 进步太大了:

1.代码质量明显提升:生成的代码可读性强,注释到位,拿来基本就能用;

2.UI 审美有了质的飞跃:不再是千篇一律的 AI 风格,开始有设计感了;

3.上下文理解更好:多轮对话中能记住之前的要求,不用反复强调;

4.主动思考能力增强:会提前询问需求细节,会主动优化代码逻辑。

跟 Claude Sonnet4.5 比呢?说实话,确实追上来了!考虑到价格:

  • GLM-4.7 的 Lite 套餐首月 20 块,后续也不贵;

  • 使用额度是Claude Pro的3倍;

  • 对于大部分日常开发需求,GLM-4.7完全够用了。

GLM-4.7 已经完整接入智谱的 Coding Plan 体系,能够与 Claude Code 等主流 AI 编程工具无缝配合。如果你在寻找一款能够应对复杂工程项目的国产编程大模型,GLM-4.7 绝对值得考虑。从性价比角度来看,GLM Coding Plan可以说是今年 AI 编程领域最值得入手的选择之一。

隐藏彩蛋


阿姨助我,Coding无敌!

冬天写代码真的冷。这次智谱搞了个暖心活动:订阅了 GLM Coding Plan 的用户,在 Claude Code 里接入 GLM 后,输入"阿姨助我!",就能领一杯沪上阿姨的「QQ美莓奶茶」。

我试了一下,敲完代码顺手输入这句话,几秒钟兑换券就来了。

四、总结


这次测试让我最大的感受是:国产 AI 真的在快速追赶,而且性价比优势明显。GLM 从 4.6 到 4.7,有这么大的提升,这个迭代速度确实让人期待后续的版本。

如果你也在开发项目,不妨去试试 GLM-4.7。特别是那些日常的工具开发、脚本编写、原型验证,用它真的能省不少时间和预算。

对了,我测试时用的是他们的 Lite 套餐,首月 20 块钱,量很够用。

而且,智谱推出了两项福利活动:一是 GLM Coding Plan 体验卡,邀请好友注册,能免费获得 7 天 AI 编程体验。二是邀好友,拼好模,邀请好友订阅,可获得最高 20% 返现。

如果你也需要一个靠谱的AI编程助手,不妨去试试GLM-4.7,说不定会给你带来惊喜。

最后,再放上 GLM-4.7 的使用网址:

https://bigmodel.cn/glm-coding

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐