智谱 AI 推出 GLM-4 模型全家桶,性能比肩 GPT-4
2024-01-18 16:01
NFT 营销工场
2024-01-18 16:01
订阅此专栏
收藏此文章




编辑|方奇

媒体|AI 大模型工场



在国产大模型赛道,成立于 2019 年的智谱 AI 是其中一颗亮眼的“新星”,该公司的核心团队源自清华学术团队,是国内最早研发大模型的企业之一。


在去年 10 月底,智谱 AI 官方披露,公司 2023 年已累计获得超 25 亿人民币融资,投资方包括社保基金、阿里、腾讯、高瓴等知名机构。目前,智谱 AI 估值已经超过 100 亿人民币。


2024 开年,智谱 AI 全面展示了其投身于大模型事业三年多来所积累的技术成果。1 月 16 日,智谱 AI 在其首届技术开放日正式发布了新一代基座大模型 GLM-4。


智谱 AI 的 CEO 张鹏表示,GLM-4 的整体性能相比上一代大幅提升,逼近 GPT-4。它可以支持更长的上下文,具备更强的多模态能力。同时,它的推理速度更快,支持更高的并发,大大降低推理成本。




GLM-4,比肩 GPT-4



此次 GLM-4 的发布及上线,是智谱 AI 大模型研发上的关键突破。其中有三个亮点值得关注:All Tools 能力、GLMs 个性化智能体定制、MaaS 平台和 API。


具体来看,新一代基座大模型 GLM-4,整体性能相比 GLM3 全面提升 60%,逼近 GPT-4;支持 128k 的上下文窗口长度,单次提示词可以处理的文本可以达到 300 页。


同时,在 needle test(大海捞针)测试中,AI 大模型工场获悉,在 128K 文本长度内 GLM-4 模型均可做到几乎 100% 的精度召回,并未出现长上下文全局信息因为失焦而导致的精度下降问题。同时,多模态能力方面,文生图和多模态理解都得到了增强。



此外,GLM-4 的 All Tools 能力全新发布。得益于 GLM 模型的强大 Agent 能力,GLM-4 实现了自主根据用户意图,自动理解、规划复杂指令,自由调用网页浏览器、Code Interpreter 代码解释器和文生图 CogView3 模型。


同时,GLM-4 通过代码解释器,会自动调用代码解释器进行复杂的方程或者微积分求解。对比 GSM8K、Math 以及 Math23K 三个数据集上的结果,GLM-4 All Tools 取得和 GPT-4 All Tools 相当的效果。


GLM-4 的 All Tools 能力完全自动,而且可以处理各种任务,比如包括文件处理、数据分析、图表绘制等复杂任务,支持处理 Excel、PDF、PPT 等格式的文件。


GLMs 个性化智能体定制能力也同步上线。基于 GLM-4 模型的强大能力,用户只需要用简单的提示词指令就能创建属于自己的 GLM 智能体。并且,用户可以通过全新上线的智能体中心分享自己创建的各种智能体。GLM 模型智能体的推出标志着任何人都能够自由运用 GLM-4 模型并挖掘它的潜力,没有任何编程基础也能够实现大模型的便捷开发。




共建大模型生态



智谱 AI 不仅重视基础模型能力的提升,同时重视大模型生态建设,通过与多个机构合作,共同推动人工智能领域的发展。


AI 大模型了解到,此前,智谱 AI 分别联合 CCF 中国计算机学会、中国中文信息学会社会媒体处理专委会发起了 CCF- 智谱大模型基金、SMP- 智谱大模型交叉学科基金,用于支持大模型理论、算法、模型、应用等相关研究和跨领域交叉创新。



去年两支基金为来自全国三十余所高校参与的 41 个研究项目累计提供了超 1000 万元现金和算力资源的科研支持。


2024 年,智谱 AI 也将发起开源开放的大模型开源基金,该计划包括三个“一千”:


  • 智谱 AI 将为大模型开源社区提供一千张卡,助力开源开发;

  • 提供 1000 万元的现金用来支持与大模型相关的开源项目;

  • 为优秀的开源开发者提供 1000 亿免费 API tokens。


张鹏表示,大模型开源基金的目的在于推动大模型研发的大进展,促进大模型整个开源生态的大繁荣。面对全球的大模型创业者,智谱 AI 也将“Z 计划”进一步升级,联合生态伙伴发起总额 10 亿人民币的大模型创业基金用于支持大模型原始创新,覆盖大模型算法、底层算子、芯片优化、行业大模型和超级应用等方向。


AIGC 大模型工场已经组织了非常精准的「AI 大模型垂直社群」,覆盖超 1000 位 AIGC 圈,百度大模型业务负责人,京东大模型业务负责人,腾讯大模型业务人,阿里云大模型技术负责人,科大讯飞大模型公关,商汤大模型业务,阅文大模型公关,360 大模型公关负责人都在群里啦,欢迎大模型业务负责人加入。请加微信 fqq2000nian,注明真实身份。


数据支持天眼查,大模型独家合作账号

— END —

监制 / 刘老师
编辑 / AIGCCCCC
视觉 / 大模型
微博 / @AI 大模型工场
TG/AI  Marketing Field

  


大模型应用创业者,你怎么看

■ 百度文心一言,阿里通义千问   ▍通用大模型案例

                 ■ 科大讯飞星火 京东  ▍产业大模型案例

■ 商汤日日新、腾讯,昆仑万维   ▍ 金融大模型案例

■ 盘古大模型,中国电信,医联 ▍医疗大模型案例

■阅文大模型,腾讯音乐大模型 ▍ 文娱大模型案例

■知乎,360 大模型,火山引擎 ▍ 教育大模型案例

■  网易,金山办公大模型   ▍    更多行业大模型案例



上次介绍 2024 大模型发展十大趋势判断链接





本文由大模型领域垂直媒体「AI 大模型工场」

原创出品,未经许可,请勿转载。 

/

欢迎提供新的大模型商业化落地思路

【免责声明】市场有风险,投资需谨慎。本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

NFT 营销工场
数据请求中
查看更多

推荐专栏

数据请求中
在 App 打开