9 月 30 日,中国大模型厂商智谱正式发布并开源新一代大模型 GLM-4.6。据官方介绍,该模型在公开基准测试与真实编程任务中表现亮眼,代码生成能力全面对齐 Claude Sonnet4,跻身国内最强 Coding 模型行列,同时在长上下文处理、推理、信息检索、文本生成及智能体应用等维度实现全方位升级。
作为开源模型,GLM-4.6 还在国产硬件适配领域取得突破:已在寒武纪国产 AI 芯片上实现 FP8+Int4 混合量化推理部署,成为首个落地国产芯片的该类模型 - 芯片一体化方案;此外,摩尔线程也基于 vLLM 推理框架完成适配,其新一代 GPU 可支持模型在原生 FP8 精度下稳定运行。
