news 2026/4/23 10:12:47

GLM-4.5-Air开源:120亿参数智能体模型免费商用

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
GLM-4.5-Air开源:120亿参数智能体模型免费商用

GLM-4.5-Air开源:120亿参数智能体模型免费商用

【免费下载链接】GLM-4.5-AirGLM-4.5 系列模型是专为智能体设计的基础模型。GLM-4.5拥有 3550 亿总参数量,其中 320 亿活跃参数;GLM-4.5-Air采用更紧凑的设计,拥有 1060 亿总参数量,其中 120 亿活跃参数。GLM-4.5模型统一了推理、编码和智能体能力,以满足智能体应用的复杂需求项目地址: https://ai.gitcode.com/zai-org/GLM-4.5-Air

导语:智谱AI正式开源GLM-4.5-Air大模型,以120亿活跃参数的紧凑设计和MIT许可证下的免费商用权益,为智能体应用开发提供了高性能且低成本的解决方案。

行业现状:随着大语言模型技术的快速迭代,智能体(AI Agent)已成为行业发展的重要方向。根据近期行业报告,具备自主决策、工具使用和复杂任务处理能力的智能体模型正逐步渗透到企业服务、自动化办公、智能交互等多个领域。然而,高性能大模型普遍存在部署成本高、商用授权复杂等问题,制约了中小型企业和开发者的创新应用。在此背景下,兼具性能与经济性的开源模型成为市场迫切需求。

产品/模型亮点:GLM-4.5-Air作为GLM-4.5系列的轻量版,核心优势体现在三个方面:

首先是高效的参数设计。该模型采用1060亿总参数配合120亿活跃参数的混合专家(MoE)架构,在保持轻量化部署特性的同时,实现了推理、编码与智能体能力的统一。据官方测试数据,其在12项行业标准基准测试中综合得分为59.8,在同量级模型中表现突出。

其次是创新的混合推理模式。模型支持"思考模式"与"非思考模式"双模式切换:前者适用于复杂逻辑推理和工具调用场景,可通过多轮思考提升任务完成质量;后者则针对简单问答提供即时响应,显著降低计算资源消耗。这种设计使模型能灵活适配不同复杂度的应用需求。

最后是宽松的商用条款。GLM-4.5-Air采用MIT开源许可证,允许开发者免费用于商业用途和二次开发,大幅降低了企业级应用的技术门槛。官方同时提供了与Transformers、vLLM、SGLang等主流框架的适配代码,简化了本地化部署流程。

行业影响:GLM-4.5-Air的开源可能加速智能体技术的普及应用。对于企业用户而言,120亿参数规模意味着可在单GPU服务器上实现高效部署,将显著降低AI基础设施投入;对开发者社区来说,开放的模型权重和推理代码为研究智能体架构、优化模型性能提供了优质样本。值得注意的是,其3550亿参数的完整版GLM-4.5已在综合评测中获得63.2分,位列全球模型性能第三,显示出该系列在技术上的竞争力。

结论/前瞻:随着GLM-4.5-Air的开源,大模型行业正迎来"高性能与低成本"并行发展的新阶段。这种"核心模型闭源+轻量版本开源"的策略,既保护了企业的核心技术优势,又通过生态共建扩大了技术影响力。未来,随着智能体应用场景的深化,具备工具调用能力、多模态交互和低资源部署特性的模型将成为竞争焦点,而开源社区的创新活力或将推动行业加速进入"智能体普及期"。

【免费下载链接】GLM-4.5-AirGLM-4.5 系列模型是专为智能体设计的基础模型。GLM-4.5拥有 3550 亿总参数量,其中 320 亿活跃参数;GLM-4.5-Air采用更紧凑的设计,拥有 1060 亿总参数量,其中 120 亿活跃参数。GLM-4.5模型统一了推理、编码和智能体能力,以满足智能体应用的复杂需求项目地址: https://ai.gitcode.com/zai-org/GLM-4.5-Air

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/18 21:17:10

SAM 3化工行业:反应过程分割系统部署

SAM 3化工行业:反应过程分割系统部署 1. 引言 在化工生产过程中,实时监控和精确识别反应过程中的关键物质与设备状态是保障安全生产和提升效率的核心需求。传统视觉监控系统往往依赖预定义规则或固定模型,难以应对复杂多变的工况环境。随着…

作者头像 李华
网站建设 2026/4/17 13:41:54

猫抓cat-catch:浏览器资源嗅探与下载的终极指南

猫抓cat-catch:浏览器资源嗅探与下载的终极指南 【免费下载链接】cat-catch 猫抓 chrome资源嗅探扩展 项目地址: https://gitcode.com/GitHub_Trending/ca/cat-catch 在当今多媒体内容丰富的互联网时代,如何高效地获取网页中的视频、音频资源成为…

作者头像 李华
网站建设 2026/4/23 10:10:05

OpenCode性能优化:让AI编程速度提升3倍

OpenCode性能优化:让AI编程速度提升3倍 在AI辅助编程日益普及的今天,响应延迟和推理效率成为影响开发者体验的核心瓶颈。OpenCode作为一款终端优先、支持多模型接入的开源AI编程助手,虽然具备强大的功能扩展性与隐私保障机制,但在…

作者头像 李华
网站建设 2026/4/15 18:48:23

RAGAS评估框架:从零开始的全面应用指南

RAGAS评估框架:从零开始的全面应用指南 【免费下载链接】ragas Evaluation framework for your Retrieval Augmented Generation (RAG) pipelines 项目地址: https://gitcode.com/gh_mirrors/ra/ragas 在当今AI技术快速发展的时代,构建高质量的检…

作者头像 李华
网站建设 2026/4/18 7:10:40

Qwen2.5智能写作助手实战:内容生成系统部署

Qwen2.5智能写作助手实战:内容生成系统部署 1. 引言 1.1 业务场景描述 在当前内容创作需求激增的背景下,自动化写作工具已成为提升内容生产效率的关键。无论是新闻摘要、技术文档撰写,还是营销文案生成,高质量的语言模型正在逐…

作者头像 李华
网站建设 2026/4/23 9:52:31

RAGAS评估框架:从零开始的完整实战手册

RAGAS评估框架:从零开始的完整实战手册 【免费下载链接】ragas Evaluation framework for your Retrieval Augmented Generation (RAG) pipelines 项目地址: https://gitcode.com/gh_mirrors/ra/ragas 你是否曾经困惑于如何准确评估你的RAG系统质量&#xff…

作者头像 李华