
1月8日,北京智谱华章科技股份有限公司(02513.HK)(简称“智谱”)赴港上市。
今日,据智谱官方披露,清华大学计算机系教授、智谱创立发起人兼首席科学家唐杰发布内部信,讲述智谱创立以来的迭代过程,并宣布很快将推出新一代模型GLM-5。
唐杰称,2020年,智谱推出自研大模型算法架构GLM,尝试训练100亿参数基座模型,得到包括美团在内的很多企业试用。但当时的成功距离梦想中的AGI还遥不可及,部分原因是模型的知识量还不够大,而另一部分原因是模型还不会像人一样推理思考。
2021到2022年,大模型发展并不顺利,大多数人并不接受“让机器像人一样思考”这种类似登月一样的疯狂计划,也不认为这可能是个非常大的技术变革机会,或害怕失败。团队还是决定赌一把,用更多数据训练1300亿参数大模型。
唐杰称,这个决策很难,因为不能影响公司总体发展节奏,为此成立两个专门的小型创新团队,一个负责模型训练,即后来的GLM三剑客;另一个独立负责MaaS平台建设。
2022年中,GLM-130B诞生,MaaS平台上线,公司有了第一批真正的API用户。随后,团队正式成立AI院,专注下一代大模型研发;成立MaaS平台部,负责对外提供大模型API服务。
2023年,唐杰意识到AI将颠覆搜索与浏览器,会给每个人带来一个全新的AI助手,这些变革将彻底重塑计算机底层逻辑。2023至2024年,全球大模型爆发,大厂纷纷“All-in”大模型,国内也掀起创业高潮,百模大战、各种AI助手层出不穷。唐杰复盘称,当时团队也有失误,包括技术层面与商业层面,原因在于追逐AGI路上被眼前的短期收益与热闹所迷惑。
所幸,DeepSeek的出现令团队警醒。当然,也带来挑战。唐杰称,2025年年初,“一切都那么难,模型效果达不到预期,全国上下价格战,杀出重围需要找到一个精准的突破口。”所幸,团队确定Coding方向,从4月GLM-4.1的试探性发布,到7月底GLM-4.5的“决战”,所有技术、平台、业务团队捏一把汗。最终全球184个国家的15万开发者使用GLM Coding Plan,GLM-4.7发布后MaaS平台ARR年化收入超过5亿(其中海外收入超过2亿),从2000万到5亿(25倍)仅用了10个月。
过去一年行业讨论大模型主要聚焦应用与生态,但唐杰认为,真正决定下一阶段格局的是更底层的两件事——模型架构与学习范式。同时,应用侧可能会出现一个清晰的方向:AI替代不同工种/任务的爆发年。
基于此,唐杰强调,2026年公司将聚焦于GLM-5基座大模型、全新的模型架构设计、具有更强泛化能力的RL(强化学习),并对下一代学习范式——在线学习(Online Learning)或持续学习(Continual Learning)进行前瞻性布局。
对于人才的引进与前沿技术的探索,智谱也启动建设,设立全新部门X-Lab,致力于用开放的方式把更多年轻人聚集,做前沿性探索,包括模型架构、认知范式,并孵化新项目,不局限于软件或硬件。同时扩大对外投资,让行业贯通起来。
举报 第一财经广告合作,请点击这里此内容为第一财经原创,著作权归第一财经所有。未经第一财经书面授权,不得以任何方式加以使用,包括转载、摘编、复制或建立镜像。第一财经保留追究侵权者法律责任的权利。如需获得授权请联系第一财经版权部:banquan@yicai.com 文章作者
吕倩
相关阅读
AI进化速递 | 马斯克旗下X平台开源推荐算法智谱发布并开源GLM-4.7-Flash模型;阿里云PolarDB发布AI数据湖库。
106 01-20 20:48
恒生科技指数开盘下跌,智谱、MiniMax股价回涨后走低机构认为港股仍在震荡向上的大趋势中,但短期市场仍面临考验。
7 108 01-20 10:16
AI进化速递 | 智谱联合华为开源新模型谷歌推出开源医疗模型MedGemma 1.5;OpenAI据悉开发代号 “Sweetpea” 硬件对标AirPods。
129 01-14 21:14
AI进化速递 | 智谱与滴滴将合作探索出行Agent场景落地自变量机器人完成10亿元A++轮融资;谷歌联合零售巨头推出通用商务协议UCP。
91 01-12 20:54
AI周报 | 智谱、MiniMax港股上市大涨;商务部回应审查Meta收购Manus谷歌市值自2019年以来首次超越苹果;英伟达发布Rubin平台6颗芯片。
197 01-11 08:09 一财最热 点击关闭景盛网配资提示:文章来自网络,不代表本站观点。