在Openai的名字之后,Zhipu刚刚发布了一种新的开源
时间:2025-08-02 08:45 作者:365bet体育投注

国内大型制造商的开放资源仍在加速。直到现在,Zhipu才正式发布了最新的旗舰型GLM-4.5。根据Zhipu的官方声明,这是“专门为代理应用程序创建的基本模型”。继续使用相同的开放资源原则,该模型是将ModelsCope平台放在拥抱面前。该模型的重量符合MIT许可,并且商业用途没有问题。 GLM-4.5的全面功能达到了开放资源模型,代码和代理的SOTA级别; GLM-4.5采用了混合专家(MOE)的体系结构,包括GLM-4.5:参数的总数为3550亿,激活参数为320亿; GLM-4.5-air:参数的总量为10060亿,激活参数为1,20亿;这两个版本都是完全开放的资源,并支持MIT许可证; GLM-4.5和GLM-4.5-Air均支持混合推理模式,提供两种模式:ThiNKING模式用于复杂的推理和工具使用,而不是思考即时响应的模式。 API呼叫小于0.8元/百万个令牌,输出2元/百万个令牌;高速版本最多可以达到100个令牌/秒。目前,GLM-4.5的技术销售更大是第一次将代理商的编码和功能本地整合到单个模型中。 GLM-4.5说,其他人的模型要么在推理,代码写作或担任助手方面都很出色,要么是助手,他们想要一切。对于旧规则,让我们首先查看新模型的“运行分数”链接。 Zhipu选择了12个代表性分析基准的大部分为“显示肌肉”,包括MMLU Pro,Aime 24,Math 500,Scicode,GPQA,HLE,HLE等。这些也是我们的“以前的熟人”。根据结果,GLM-4.5用第二大全球模型,第一个国内模型和第一个开放资源模型提供了卡报告。当然,跑步分数是没有用的,而且更多的实践cal尝试它是令人信服的。为了验证现实生活代理编码中的GLM-4.5强度,Zhipu仅直接连接到Claude Code并与Claude-4-Sonnet,Kimi-K2,Qwen3-编码和其他模型竞争。测试计划非常顽固:共有52种开发和发展活动,涵盖了六个主要的开发领域,所有这些领域都是在独立容器中进行的,重点是真正的实践。结果表明,尽管面对Claude-4-sonnet时,GLM-4.5在该工具对工具的可靠性和完成任务的可靠性方面仍然具有出色的性能。尽管Zhipu揭示了所有测试问题和代理轨迹(https://huggingfang ace.co/datasets/zai-org/cc-cench-cench-traightory)让我有一种感觉,可以让我的同龄人在“反counteriting”中拥抱我的同龄人。让我们看一些更具说服力的演示,具有良好的价值。只需输入“创建Google搜索网站”的提示字。 GLM-4.5实际上可以在句子中生成一个非常有用的搜索引擎。 GLM-4.5创建的音量函数框具有完整的功能,该功能完美地反映了模型的全面技能。更复杂的是,它还可以生成Mai -Click 3D地球页面。用户可以单击位置以查看详细信息,并附有光滑的缩放动画。 ▲提示单词:使用Trix.js和JavaScript开发一个网页,该网页根据数组创建了我访问的3D世界显示区域。单击3D Globe中的标记将使变焦效果动画,并打开带有图片的详细旅行信息。与使用模板填充信息的传统AI PPT工具不同,GLM-4.5独立于搜索信息和查找图片,并根据实际材料直接在HTML中写下照片和文本。除了常规16:9的比例外,它还为社交媒体上限,长图片,小红书卡甚至继续提供灵活的支持。Likeas开发人员经历了这一经验,国内制造商也开始知道“滚动”。例如,GLM-4.5与Claude Code,Cline和Roo Code等主要代码代理兼容。请参阅完整的使用指南:国内用户:https://docs.bigmodel.cn/cn/guide/guide/develop/claude/claude offease:https://docs.z.ai/scenario-example-example glm-4 .5。冷知识:GLM-4.5参数仅是KIMI-K2的DeepSeek-R1和1/3的1/2,但性能不是折扣,这是由于GLM模型参数的效率更高。尤其是使用106B总参数 / 12B激活参数的GLM-4.5-air,通过理解检查接近Gemini 2.5 Flash和Claude 4十四行诗。在SWE基础验证的列表中,它还提前排名性能比/参数 - 换句话说,数量较少,它将获得更好的有效性。在绩效提高的背后,培训过程中的“奇迹暴力”是密不可分的。 GLM-4.5和GLM-4.5-空气使用类似的训练过程:首先在15万亿个标准数据令牌中进行预培训。然后,在代码字段,推理,代理等的8万亿代币数据中进行了目标训练,最后,通过研究增强加固,进一步增强了模型,代码和代理能力的识别。有了金钱和资源,您可以做自己想做的事。此外,成本和效率下降的降低可能更致命。 API呼叫价格小于0.8元/百万令牌输入和2元/百万个令牌的输出。同时,高速腐烂的测试Generation的实际速度最多可以达到100个令牌/秒,从而支持实际的低潜伏期扩张和高折叠率,真正的可怕价格。当前,API被启动为Open BigModel.cn平台,该平台与Claude Code Framework兼容。普通用户还可以访问Zhipu Qingyan(gatglm.cn)和Z.AAI,体验GLM-4.5的全血版本。 rZhipu atning是一家具有相对稳定的生长动量的制造商。步伐并不混乱,可以保持模型的重复,开放尺度可以放松,方向感觉也没有浮动。这样,它就不足为奇了,它可以成为“ AI六小龙”推出IPO的第一个球员。