编辑|方奇
媒体|AI 大模型工场
在国产大模型赛道,成立于 2019 年的智谱 AI 是其中一颗亮眼的“新星”,该公司的核心团队源自清华学术团队,是国内最早研发大模型的企业之一。
在去年 10 月底,智谱 AI 官方披露,公司 2023 年已累计获得超 25 亿人民币融资,投资方包括社保基金、阿里、腾讯、高瓴等知名机构。目前,智谱 AI 估值已经超过 100 亿人民币。
2024 开年,智谱 AI 全面展示了其投身于大模型事业三年多来所积累的技术成果。1 月 16 日,智谱 AI 在其首届技术开放日正式发布了新一代基座大模型 GLM-4。
智谱 AI 的 CEO 张鹏表示,GLM-4 的整体性能相比上一代大幅提升,逼近 GPT-4。它可以支持更长的上下文,具备更强的多模态能力。同时,它的推理速度更快,支持更高的并发,大大降低推理成本。
此次 GLM-4 的发布及上线,是智谱 AI 大模型研发上的关键突破。其中有三个亮点值得关注:All Tools 能力、GLMs 个性化智能体定制、MaaS 平台和 API。
具体来看,新一代基座大模型 GLM-4,整体性能相比 GLM3 全面提升 60%,逼近 GPT-4;支持 128k 的上下文窗口长度,单次提示词可以处理的文本可以达到 300 页。
同时,在 needle test(大海捞针)测试中,AI 大模型工场获悉,在 128K 文本长度内 GLM-4 模型均可做到几乎 100% 的精度召回,并未出现长上下文全局信息因为失焦而导致的精度下降问题。同时,多模态能力方面,文生图和多模态理解都得到了增强。
此外,GLM-4 的 All Tools 能力全新发布。得益于 GLM 模型的强大 Agent 能力,GLM-4 实现了自主根据用户意图,自动理解、规划复杂指令,自由调用网页浏览器、Code Interpreter 代码解释器和文生图 CogView3 模型。
同时,GLM-4 通过代码解释器,会自动调用代码解释器进行复杂的方程或者微积分求解。对比 GSM8K、Math 以及 Math23K 三个数据集上的结果,GLM-4 All Tools 取得和 GPT-4 All Tools 相当的效果。
GLM-4 的 All Tools 能力完全自动,而且可以处理各种任务,比如包括文件处理、数据分析、图表绘制等复杂任务,支持处理 Excel、PDF、PPT 等格式的文件。
GLMs 个性化智能体定制能力也同步上线。基于 GLM-4 模型的强大能力,用户只需要用简单的提示词指令就能创建属于自己的 GLM 智能体。并且,用户可以通过全新上线的智能体中心分享自己创建的各种智能体。GLM 模型智能体的推出标志着任何人都能够自由运用 GLM-4 模型并挖掘它的潜力,没有任何编程基础也能够实现大模型的便捷开发。
智谱 AI 不仅重视基础模型能力的提升,同时重视大模型生态建设,通过与多个机构合作,共同推动人工智能领域的发展。
AI 大模型了解到,此前,智谱 AI 分别联合 CCF 中国计算机学会、中国中文信息学会社会媒体处理专委会发起了 CCF- 智谱大模型基金、SMP- 智谱大模型交叉学科基金,用于支持大模型理论、算法、模型、应用等相关研究和跨领域交叉创新。
去年两支基金为来自全国三十余所高校参与的 41 个研究项目累计提供了超 1000 万元现金和算力资源的科研支持。
2024 年,智谱 AI 也将发起开源开放的大模型开源基金,该计划包括三个“一千”:
智谱 AI 将为大模型开源社区提供一千张卡,助力开源开发;
提供 1000 万元的现金用来支持与大模型相关的开源项目;
为优秀的开源开发者提供 1000 亿免费 API tokens。
张鹏表示,大模型开源基金的目的在于推动大模型研发的大进展,促进大模型整个开源生态的大繁荣。面对全球的大模型创业者,智谱 AI 也将“Z 计划”进一步升级,联合生态伙伴发起总额 10 亿人民币的大模型创业基金用于支持大模型原始创新,覆盖大模型算法、底层算子、芯片优化、行业大模型和超级应用等方向。
■ 科大讯飞星火 京东 ▍产业大模型案例
■ 商汤日日新、腾讯,昆仑万维 ▍ 金融大模型案例
■ 盘古大模型,中国电信,医联 ▍医疗大模型案例
■阅文大模型,腾讯音乐大模型 ▍ 文娱大模型案例
■知乎,360 大模型,火山引擎 ▍ 教育大模型案例
■ 网易,金山办公大模型 ▍ 更多行业大模型案例
上次介绍 2024 大模型发展十大趋势判断链接
本文由大模型领域垂直媒体「AI 大模型工场」
原创出品,未经许可,请勿转载。
/
欢迎提供新的大模型商业化落地思路
【免责声明】市场有风险,投资需谨慎。本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。