来源|智东西 Plus
自 ChatGPT 面世以来,生成式 AI 已加速狂飙 16 个月,在学术界、产业界、投资界掀起滔天巨浪,冲击着千行百业。
AI 大模型飞速迭代,创新应用层出不穷。我们正处于技术野蛮生长的爆发时刻,见证着 AI 向通用人工智能全速冲刺的破竹之势。
值此之际,由智一科技旗下智东西联合智猩猩发起主办的 2024 中国生成式 AI 大会将于 4 月 18 日 -19 日在北京 JW 万豪酒店举办。今年大会以“重构世界 奔赴未来”为主题,拟邀请 50+ 位重量级嘉宾同台分享,以前瞻性视野全景式解构生成式 AI 的时与势、危与机、破与立。这是继 2023 年举办国内首场聚焦 AIGC 的高规格创新峰会后,智一科技旗下智东西联合智猩猩发起主办的第二届生成式 AI 行业盛会。
大会由主会场峰会 + 分会场研讨会 / 论坛 + 展览 + 榜单组成,其中主会场第一日将进行开幕式、大模型专场,第二日将进行 AI Infra 专场、AIGC 应用专场;分会场第一日下午将进行智猩猩具身智能技术研讨会,第二日上下午分别进行智猩猩 AI 智能体技术研讨会、以及中国智算中心创新论坛。【 AI 生产力创新先锋 - 中国生成式 AI 企业 TOP50】榜单将在大会第二日上午正式揭晓。
目前已有 50+ 位嘉宾确认参与主题演讲、高端对话和圆桌讨论,接下来为大家详细介绍部分嘉宾
主会场部分嘉宾阵容
NVIDIA 解决方案架构与工程总监 王淼。
演讲主题:《NVIDIA 面向大语言模型的全栈 AI 解决方案》
内容概要:本演讲将深入探讨如何创建为大语言模型(LLM)设计的稳定、健壮且高效的数据中心架构。我们将利用 NVIDIA LLM 训练框架、Transformer Engine 上的 FP8 训练以及多精度训练(MPT)的能力,揭开 NVIDIA 针对 LLM 的全栈软件和硬件整体流水线的神秘面纱。此外,我们还将讨论 NVIDIA 训练和推理解决方案的最佳实践,包括 NVIDIA TensorRT、TensorRT-LLM、Triton Inference Server 等,所有这些都是 NVIDIA AI Enterprise 套件的 AI 组件。这些内容将让您全面了解如何在 NVIDIA 加速的基础设施中优化 LLM 性能。
爱诗科技创始人兼 CEO 王长虎
爱诗科技创始人兼 CEO 王长虎博士,深耕计算机视觉与人工智能领域 20 年。
曾任字节跳动视觉技术负责人,带领字节跳动视觉技术团队在巨量规模的用户数据下,解决了多个视觉领域的世界级难题,并从 0 到 1 支撑了抖音与 TikTok 等国民级视频产品的建设和发展。任职期间开发的多模态大模型有效覆盖字节跳动内视觉相关产品内容价值链全流程,包括了从内容生产、内容安全、内容分析、内容分发以及内容商业化。
曾任微软亚洲研究院主管研究员,主要研究方向包括计算机视觉、机器学习、多媒体分析等,发表了近百篇国际顶级会议和期刊文章,是 20+ 国际顶级会议与期刊的编委或审稿人。世界草图搜索与识别的开拓者之一,曾带领团队建成了世界最早的十亿级的草图搜索引擎系统,并因此获得微软公司金星奖、世界多媒体大会最佳演示奖。
中国计算机学会 2018 年科技进步卓越奖获得者,曾任中国计算机学会理事,获中国科技大学学士及博士学位。
启明创投合伙人 周志峰
周志峰先生是启明创投的合伙人。周志峰先生是前沿科技领域最活跃的投资人之一,他目前关注的领域包括人工智能、机器人、虚拟 / 增强现实、半导体、新能源汽车和企业软件等。周志峰先生投资的企业中有 10 余家成长为上市企业及独角兽企业:石头科技(688169.SH)、星环科技(688031.SH)、优必选(09880.HK)、壁仞科技、洛轲智能、云英谷科技、智谱 AI、云知声、梅卡曼德机器人、爱芯元智、海博思创、同盾科技等。他投资的其他高成长公司有:长亭科技(被阿里巴巴收购)、九州云腾(被阿里巴巴收购)、DeepWay、地上铁、云迹科技、后摩智能、衔远科技、TigerGraph、XSKY 星辰天合等。
在此之前,周志峰先生在硅谷顶级风险投资机构 Kleiner Perkins 凯鹏华盈(KPCB)工作。在开始其投资生涯前,周志峰先生任职于惠普公司,负责中国区的数据存储业务。
周志峰先生获评“福布斯中国创投人 100”。周志峰先生在美国哥伦比亚大学商学院获得工商管理硕士学位,在哈尔滨工业大学获得计算机科学与技术学士学位。
周志峰先生目前担任北京证券交易所第一届行业咨询委员会委员。周志峰先生亦是中国乡村振兴创业者支持计划的管理委员会成员,该计划由启明创投和中国乡村发展基金会联合发起,致力于培训、赋能乡村产业创业者和社会事业创业者。
新加坡国立大学校长青年教授、潞晨科技创始人兼董事长 尤洋
尤洋,新加坡国立大学校长青年教授、潞晨科技创始人兼董事长。尤洋教授是清华大学硕士,加州伯克利大学博士,新加坡国立大学计算机系的校长青年教授 (Presidential Young Professor)。
他曾创造 ImageNet、BERT、AlphaFold、ViT 训练速度的世界纪录,并被 ScienceDaily,The Next Web,i-programmer 等几十家媒体广泛报道,相关技术被广泛应用于谷歌,微软,英特尔,英伟达等科技巨头。他近三年以第一作者身份在 NIPS,ICLR,Supercomputing,IPDPS,ICS 等国际重要会议或期刊上发表论文十余篇,总计发表论文近百篇。他曾以第一作者获国际并行与分布式处理大会 (IPDPS) 的最佳论文、国际并行处理大会 (ICPP) 的最佳论文,AAAI、ACL 杰出论文等。他曾获清华大学优秀毕业生,以及当时清华大学计算机系数额最高的西贝尔奖学金。他在 2017 年获得美国计算机协会 (ACM) 官网上唯一颁给在读博士生的 ACM-IEEE CS George Michael Memorial HPC Fellowship。他获得颁发给伯克利优秀毕业生的 Lotfi A. Zadeh Prize。他被 UC Berkeley 提名为 ACM Doctoral Dissertation Award 候选人 (81 名 UC Berkeley EECS 2020 博士毕业生中选 2 人 )。他曾任职于谷歌、微软、英伟达、英特尔、IBM 等公司,2021 年入选福布斯 30 岁以下精英榜 ( 亚洲 ) 并获得 IEEE-CS 超算杰出新人奖,2023 年入选福布斯最具影响力华人精英 TOP100 以及胡润 U35 创业先锋。
演讲主题:《技术共享:类 Sora 开源架构模型与训练细节》
内容概要:随着视频内容创作和消费的迅猛增长,OpenAI Sora 凭借其出色的视频生成技术成为行业的领跑者。紧随其后,Colossal-AI 团队率先推出类 Sora 架构开源视频生成模型 Open-Sora 1.0。
本次演讲将详细介绍 Open-Sora 1.0 的复现方案,包括其三个关键阶段的训练流程:大规模图像预训练、视频预训练和数据微调,以及这些步骤如何共同作用于提升生成视频的质量和真实感。此外,演讲还将探讨数据预处理、模型训练细节和加速优化策略,以及未来的发展计划。
听众将从本次演讲中获得对 Open-Sora 1.0 模型的深入理解,包括其在视频生成领域的创新应用和实际效果。演讲将揭示模型的关键技术特点,以及如何通过高效的数据处理和训练流程实现高质量的视频生成。此外,听众将了解到如何将这些技术应用于自己的项目中,从而提升内容创作的质量和效率。演讲还将探讨模型未来的发展方向,为听众提供行业发展的新视角和灵感。通过这次演讲,听众将能够更好地把握视频生成技术的最新趋势,为自己的研究或创作工作带来新的启发和价值。
生数科技联合创始人兼 CEO 唐家渝
唐家渝,生数科技联合创始人兼 CEO,清华大学计算机系硕士,曾任北京瑞莱智慧科技有限公司副总裁,先后负责公司产品团队、AI 安全产研团队及相关业务。在此之前担任腾讯优图实验室高级产品经理、TP-LINK 手机事业部用户体验团队及界面研发团队负责人。现任科技部、工信部重大项目骨干,人工智能副高级职称,获得 20 余项发明专利授权,出版普通高等教育国家级规划教材 1 本。2021 年 9 月,在瑞莱智慧期间主导研发的“安全可靠可控的新一代人工智能平台”获评世界互联网大会世界互联网领先科技成果。
万兴科技副总裁 朱伟
朱伟,万兴科技副总裁,毕业于国防科技大学计算机应用专业,20 余年技术研发管理从业经历,长期深耕软件研发领域,精通视频编解码、音视频处理、底层非线编、AI 算法等技术,具有丰富的技术规划、软件工程、团队管理、项目管理、质量管理实战经验。
演讲主题:《天幕已启 共赴 AI 大时代》
内容概况:当前,大模型正从「图文时代 1.0」加速进入到以「音视频多媒体」为载体的 2.0 时代,万兴天幕音视频多媒体大模型顺势而生。本次演讲,万兴科技将带来音视频大模型的全球趋势新洞察,并分享公司在 AIGC 领域的最新布局与落地成果展示,以及大模型 2.0 时代下的新挑战和新机遇。天幕已启,让我们携手共赴 AI 大时代!
前 Meta 首席工程负责人 胡鲁辉
胡鲁辉,Aurorain AI Founder,前 Meta 首席工程负责人,荣获 10 项 Meta AI 美国专利申请;原京东集团副总裁和华为美研首席架构师兼 CTO;早期在美国亚马逊、微软总部工作十多年,带领团队长期从事数据云和 AI;拥有 30 多项美国专利及申请和国际顶级论文。
演讲主题:《从多模态大模型到理解物理世界》
内容概要:近年来,人工智能发展迅猛,以 ChatGPT 为代表的大型语言模型(LLM)取得了突破性进展,并在自然语言处理、图像生成等领域展现出强大能力。然而,现有的 LLM 仍然局限于特定模态的信息处理,难以理解和交互物理世界。
“后 GPT-4”时代,多模态大模型 (MM) 应运而生。MM 能够融合文本、图像、音频等多模态信息,更全面地理解和感知世界。同时,AI2.0 时代的基础模型 (foundation models) 和智能体(AI agents)也在快速发展,它们具备更强的泛化能力和鲁棒性,能够加速 MM 的应用。
理解物理世界是通用人工智能 (AGI) 的关键。 物理世界是客观存在的,具有确定性和规律性。理解物理世界需要具备对空间、时间、因果关系等概念的理解,以及对物理规律的建模和预测能力。
分享将重点探讨以下几个方面:
1. 人工智能近几年的发展历程,以及“后 GPT-4”时代的发展趋势;
2. LLM 和 MM 的特点和共性,以及 AI2.0 时代的基础模型特性;
3. 理解物理世界对世界模型和通用人工智能的重要性,以及物理世界的特性;
4. 如何从多模态大模型到理解物理世界,更加接近通用人工智能。
北京大学计算机学院前沿计算研究中心助理教授、北京银河通用机器人创始人&CTO 王鹤
王鹤博士是北京大学计算机学院前沿计算研究中心(CFCS)的助理教授和博士生导师。他创立并领导了北大具身感知与交互实验室 (EPIC Lab,主页:https://hughw19.github.io),研究目标是通过发展具身技能及具身多模态大模型推进通用具身智能。他联合创立了北京银河通用机器人有限公司,同时担任北京智源人工智能研究院具身智能研究中心主任。他已在计算机视觉、机器人学和人工智能的顶级会议和期刊(CVPR/ICCV/ECCV/TRO/RAL/ICRA/NeurIPS/ICLR/AAAI 等)上发表五十余篇工作,其论文获得 ICCV2023 最佳论文候选,ICRA2023 最佳操纵论文候选,2022 年世界人工智能大会青年优秀论文(WAICYOP)奖,Eurographics 2019 最佳论文提名奖。他担任了 CVPR2022 和 WACV2022 的领域主席,Image and Vision Computing 的副主编和诸多顶会的审稿人、程序委员。在加入北京大学之前,他于 2021 年从斯坦福大学获得博士学位,师从美国三院院士 Leonidas. J Guibas 教授,于 2014 年从清华大学获得学士学位。
天津大学计算机科学与技术学院副院长、PPIO 边缘云首席科学家 王晓飞
王晓飞,PPIO 边缘云首席科学家;天津大学计算机科学与技术学院副院长、教授、博导,国家级青年人才,中国计算机学会分布式专委会杰出青年学者,IEEE 通讯协会 Fred W. Ellersick Prize 年度最佳杂志论文奖获得者,IEEE 通讯协会亚太地区年度杰出论文奖,天津市科技进步一等奖,天津市青年科技奖。主要研究边缘智能理论、边缘计算系统架构、云边协同算法和算力网络技术体系等,发表高水平科研论文 200 余篇(含 SCI 论文 90 余篇),其中包括中科院 1 区 /CCF-A 类论文 40 余篇,中科院 2 区 /CCF-B 类论文 40 余篇,引用 9000 余次,申请授权发明专利 50 余项,担任 IEEE COMST(IF:34)等多个一二区期刊副编委和专刊编委,主持了国家自然科学基金、科技部重点研发计划等国家级省部级纵向课题多项,负责了电信、移动、亚信、华为、电科院等企业项目十余项。
演讲主题:《分布式算力网络——迈向 AGI 之路》
内容概要:大模型技术掀起了通用人工智能时代的巨幕,而如何建设低时延、高效能、泛在弹性的分布式算力基础设施以支持大模型训练推理和持续迭代成为了核心问题之一。报告将介绍分布式算力网络的发展历史、现状、趋势和难点挑战,从智能调度、服务保障、供需预测、算力交易等角度分享有关技术进展,并介绍 PPIO 算力网络与 GPU 算力云的落地实践。
中科加禾 CEO 崔慧敏
崔慧敏,博士,中科加禾 CEO。崔慧敏是中科院计算所编译团队的负责人,她的研究方向为面向人工智能和异构体系结构的编译技术,先后在 PLDI、ASPLOS、OSDI、MICRO、PPoPP、SC 等国际会议和期刊上发表论文三十余篇。中科加禾聚焦编译技术的算力解决方案,定位通用化、低成本、高性能的基础软件工具链,在国产芯片产业生态体系中补齐重要一环。
李未可科技合伙人&算法实验室负责人 古鉴
古鉴,李未可科技合伙人&算法实验室负责人,在增强现实及人工智能领域拥有近 20 年的研究经验。先后在全球顶尖 AR 实验室(新西兰坎特伯雷大学的 HitlabNZ 实验室)及新加坡国立大学进行 AR+ 相关研究,研究成果在顶级的国际学术会议(IEEE ISMAR & SIGGRAPH)上进行展示。
回国后于 2017 年加入阿里巴巴,任阿里巴巴人工智能实验室高级算法专家,期间带领团队总共发表顶会(ICCV, ECCV) 的论文 5 篇,申请专利 20 多篇,并在 ICCV 2019 Gesture Challenge Jester 榜单排名第一。
2022 年离开阿里加入李未可科技担任合伙人,主要负责李未可科技算法实验室整体规划,是李未可“WAKE-AI”大模型技术负责人。
阿里云高级技术专家、阿里云异构计算 AI 推理团队负责人 李鹏
李鹏,阿里云异构计算高级技术专家,毕业于北京航空航天大学计算机系,目前是阿里云异构计算 AI 推理团队负责人,负责生成式 AI 推理的性能优化工作,构建了 AIACC、DeepGPU 等阿里云 AI 加速套件。在 GPU 领域深耕近 10 年,其中负责的自研加速框架 AIACC 帮助阿里云在 2020 年在斯坦福 DAWNBench 竞赛的图像识别(Image Classification on ImageNet)榜单中,包揽了训练时间、训练成本、推理延迟以及推理成本四项第一。
演讲主题:《AI 基础设施的演进与挑战》
内容概要:人工智能当前已经迈入了快速发展的阶段,尤其是大语言模型的突飞猛进正给各行各业带来了日新月异的变化。AIGC 的场景对云计算 AI 基础设施与产品也提出了非常鲜明的发展要求。我将从产业一线的角度与大家一起探讨面向 AI 与大模型计算的场景下,如何构建稳定、安全、和弹性的云基础设施架构,以满足云上动辄千亿规模的参数量及极大的算力需求。
云天励飞“云天天书”大模型技术负责人 余晓填
余晓填,香港中文大学博士,云天励飞“云天天书”大模型技术负责人。“云天天书”多模态大模型层在 C-Eval、CMMLU 等权威测试中获得第一,并已正式通过国家网信办备案。
余晓填博士曾获深圳市海外高层次人才,深圳市南山区十大杰出青年(2023)。已在 AI 顶级期刊 / 会议发表论文超 20 篇,已申请 / 授权专利超 50 件。作为大数据和大模型方向的主要完成人之一,其研究成果获 2021 吴文俊人工智能科学技术奖科技进步奖一等奖。主要研究方向为大模型、序列决策、神经网络和随机优化等。
演讲主题:《多模态大模型技术演进与落地应用探索》
内容概要:在城市治理、智慧交通等应用领域,大部分场景属于碎片化、频率低的长尾场景,大模型的落地面临算法训练成本高、缺乏训练数据等行业痛点。以多模态大模型为基础,云天励飞研发的深目 AI 模盒主攻边缘训练和推理,对大模型进行了分层解耦、量化优化,使其能够高效运行在边缘的算力设备上。
本次演讲,将介绍国内外大模型技术的发展概况,并围绕智慧城市应用,提出自进化城市智能体的大模型落地框架。
鸿博股份副总裁、英博数科 CEO 周韡韡
周韡韡,现任鸿博股份副总裁、英博数科 CE0,澳大利亚阿德莱德大学金融学学士、悉尼大学传播学硕士、罗伊智库国际政治经济关系博士,历任媒体记者、策划人、投资人,10 年以上 TMT 行业从业经验、凤凰卫视驻澳大利亚记者站记者、澳中国际文化交流策划人、澳中传媒执行董事及 36 氪副总裁;在投资者关系管理、战略市场定位营销、国际化商务谈判等方面具备丰富经验及成功案例。
2022 年起负责与英伟达沟通“创新赋能中心"项目落地沟通,自 2022 年 8 月起被指定为北京·AI 创新赋能中心 CEO,后升任鸿博股份副总裁,全面负责 AI 及创新业务板块发展。
演讲主题:《算力为基,加速中国 AGI 生态建设》
内容摘要:2024 年注定是 AI 产业加速落地的一年,Sora 的爆火以及 GPT5 即将发布,都让人们看到 AI 应用落地更清晰的方向。所有的 AI 应用发展都离不开以算力基建的支持。英伟达发布 B200 芯片,推进 AI 进入新摩尔定律时代。禁售背景下,为对国内算力基建提出更严峻的挑战。
本次演讲将详细对比国内国外的智能算力的产业格局,包括智能算力需求、智算中心建设、工具链层生态、及大模型及 AI 应用的发展等,以从中探讨国内 AGI 底层算力生态发展趋势。此外,演讲还会介绍英博数科的战略规划,针对国内现阶段产业矛盾,如何以算力为基础,构筑自主可控 AGI 全栈生态服务平台。
中科曙光智能计算产品事业部副总经理 胡晓东
胡晓东,曙光信息产业股份有限公司智能计算产品事业部副总经理,负责国产智能计算产品运营和行业解决方案行业应用。近年来,主导多个智能算力基础设施项目规划及建设,推动以算力驱动的人工智能应用解决方案在科研、政府和制造业等领域的应用和落地。
星环科技大模型产品负责人 童欣欣
童欣欣,星环科技大模型产品负责人,现负责星环科技人工智能产品线大模型相关产品的架构设计等工作。曾就职于苏宁技术研究院、地平线等企业,具有多年算法研发,AI 通用平台和垂直领域业务场景的产品设计经验。
演讲主题:《Sophon LLMOps:企业级大模型和应用开发工具链》
内容概要:近年,随着大模型相关技术的火热发展,企业开始逐步尝试将大模型能力与自有业务相结合落地智能应用,在某些场景下也看到了提效的可能性。然而,当下要把大模型落到不同业务场景当中,解决具体的业务问题,意味着要做大量的微调优化和定制化开发。即,技术发展和业务需求之间存在着不小的“隔阂”,要缩小这种隔阂或者提升弥补“隔阂”的效率,完善的工具链会非常重要。即,我们认为企业在部署大模型或应用时,需要端到端的、更高效、更安全、方便协作的工具平台作为支撑。
安谋科技(中国)有限公司产品总监 杨磊
杨磊先生现任安谋科技产品总监,负责“周易” NPU IP 产品,致力于满足多样化端侧硬件设备的不同 AI 计算需求。他在芯片设计领域拥有丰富经验,涵盖了从通信基带到 AP SoC 架构设计等多个方面。加入安谋科技以来,杨磊先生负责 NPU IP 产品的定义、推广以及落地应用。
杨磊先生毕业于清华大学电子系,拥有清华大学电子系本科及硕士学位。
演讲主题:《大模型端侧部署提速,NPU 赋能终端算力革新》
内容概要:随着 AI 大模型持续向边缘侧和端侧渗透,AI 计算和推理工作正逐步由云端迁移至手机、PC、汽车等智能终端产品上运行,在这一过程中,NPU(神经网络处理器)能够以其更简单的控制流、更高的效率以及更低的功耗处理 AI 工作负载,特别是在视觉、语音及自动驾驶等高度依赖实时性的应用场景中表现出色。安谋科技自研 NPU 处理器,具备高件能、高能效和灵活配置等特点,为 AI、物联网、智能汽车等新兴领域不断迭代的计算需求提供更为全面和高效的解决方案。
联汇科技 COO 姚一杨
姚一杨博士,联汇科技 COO,在计算机视觉、人工智能和物联网安全等领域拥有深厚的专业知识和独到见解,并且长期从事信息安全与信息建设管理研究。多次主持、参与“十三五”国家重点研发计划、工信部工业互联网创新发展工程等课题项目,并取得重大突破。在多模态人工智能研究方面,首创了 160 亿参数全场景电力设备领域预训练大模型,推动了电力智能巡检应用从感知向认知演进,实现了基础理论 - 关键技术 - 设备平台的系统性创新,项目成果达到国际领先水平。
担任中国计算机自动测量与控制技术协会理事,科技核心期刊《计算机测量与控制》编委及 ACM(国际计算机学会)中国理事会杭州分会执行委员会委员等学术团体工作。
阳光保险集团人工智能首席科学家 杜新凯
杜新凯,阳光保险集团人工智能首席科学家,负责阳光保险人工智能工作。国家科技部科技创新 2030 新一代人工智能重大项目评审专家,中国人工智能产业发展联盟金融人工智能委员会副主任,中国人工智能学会、中国计算机学会、中国中文信息学会人工智能专委会专家,中国企业联合会、中国移动通信联合会智库专家,中国计算机学会 (CCF) 中文信息技术专委会专委,中国人工智能和大数据百人会首批专家。
演讲主题:《阳光正言大模型的研发及应用探索》
内容概要:本次演讲将重点介绍阳光正言大模型平台能力和目前的实际生态应用,以及阳光正言大模型在金融保险领域的未来布局。
极佳科技创始人&CEO 黄冠
黄冠,极佳科技创始人&CEO,拥有超过十年的视觉和 AI 方向技术和应用经验,在国内最早开始视频生成和世界模型方向研发和应用,拥有丰富的经验和成果,发布了 DriveDreamer、WorldDreamer、HumanDreamer 等相关代表性工作;带领团队多次获得 COCO、FRVT 等国际权威视觉和 AI 比赛世界冠军,发表视觉和 AI 顶级会议期刊论文十余篇,多次发布 WebFace260M、BEVDet 等具有显著影响力的视觉技术成果。黄冠是清华大学创新领军工程博士,中科院自动化所硕士,曾就职于微软亚洲研究院、三星中国研究院、地平线机器人等知名企业,并有多年的 AI 方向连续创业经验,在超大规模视觉 AI 模型和系统方向拥有丰富的算法研发、工程落地和商业化应用经验。
演讲主题:《技术与应用闭环,从视频生成走向世界模型》
内容概要:今年 2 月,OpenAI 发布了 Sora,并把 Sora 看作世界模拟器,Sora 展示了生成式 AI 在创造高质量、动态视频内容方面的重大进步。同时,我们更处在一个充满可能性的转折时刻,从视频生成走向世界模型,AGI 的边界正在被重新定义,有了更广泛的影响,更多的应用场景正在不断展现,通用智能的路径也在不断清晰。
极佳科技是一家专注视频生成和世界模型技术和应用的公司,在国内最早开始视频生成和世界模型相关研究和应用。本次演讲将探讨视频生成、世界模型相关技术的发展以及和产业的深度结合,通过不断的“新质生产力”,促进“人工智能 +”大规模落地。
行者 AI 创始人&CEO 尹学渊
尹学渊,行者 AI(成都潜在人工智能科技有限公司)创始人&CEO,博士,连续创业者,机器学习、人工智能领域专家。毕业于四川大学计算机学院,成功申请国家自然科学基金项目,曾负责多个国家级研发项目,申请发明专利 50 余项,在国内外期刊及会议发表论文 20 余篇。荣获“成都市新经济百名优秀人才”,“成都市建设具有全国影响力的科技创新中心先进个人”、“国家示范性软件学院优秀研究生”等称号,入选成都市软件产业“蓉贝”计划。
2013 年联合创立龙渊网络,推出了多款受到全球玩家欢迎的产品,如“多多自走棋”(Auto Chess)等。2020 年创立了行者 AI,致力于用人工智能和机器学习技术提高游戏和文娱行业的生产力,提供游戏全生命周期的解决方案。凭借自研算法,先后推出了 AI 虚拟玩家、AI 安全、AI 美术、AI 音乐等多项产品。
极睿科技创始人兼 CEO 武彬
武彬,极睿科技创始人兼 CEO,清华大学计算机系本科、人工智能实验室硕士,辅修大数据研究中心优秀毕业生,在校期间多次参与 973、863 重点项目。北京 U30 杰出青年、工信部中小企业领军人才计划、2019 福布斯中国 U30 精英,2020 福布斯亚洲 U30 精英。
演讲主题:《AIGC 全链路电商内容生成的前景与挑战》
内容概要:从目前电商内容制作高成本、低效率的痛点出发,基于极睿科技在 AIGC 领域领先的技术实力,介绍了 AI 商拍产品 PhotoMagic、图文生成与商品多平台上架产品易尚货、商品短视频智能运营产品 iClip 易视频、直播切片智能生成产品 iCut 直剪,帮助品牌通过 AI 提升内容制作效率、降低内容制作,通过优质内容实现高效种草与成交。
VAST 创始⼈、CEO 宋亚宸
宋亚宸,VAST 创始⼈、CEO,毕业于约翰霍普⾦斯⼤学,曾在商汤负责业务战略规划及落地,实现 AIGC 技术在动画及游戏⾏业的实际落地,并参与创立了 MiniMax。作为一位技术及游戏热爱者,他带领团队发布了 3D 生成大模型 Tripo,能够实现 8 秒文字 / 图片生成高精度的 3D 模型,并和 Stability AI 共同发布了开源大模型 TripoSR。
演讲主题:《大模型 Tripo 驱动 3D 生成迈入秒级时代》
内容概要:在当今科技飞速发展的时代,3D 创作正经历着前所未有的变革。3D 内容正逐渐融入日常生活,无论是虚拟现实、增强现实、游戏还是影视制作,都将因此受益匪浅。而传统的 3D 建模过程往往耗时耗力,但现在 Tripo 凭借其创新的 3D AI 技术,实现秒级 3D 创作。
本次演讲将探讨 Tripo 如何利用先进的人工智能算法和强大的计算能力,实现秒级 3D 创作。我将深入讲解其核心技术并展示这些技术如何将文字描述转化为 3D 模型和互动体验。此外,我还将分享 Tripo 在降低 3D 内容创作门槛、推动创意经济发展等方面的愿景。最后,将为大家示范 Tripo 的创作生态,让观众亲身体验秒级 3D 建模的效率及创造力。
DeepMusic CEO 刘晓光
刘晓光,DeepMusic CEO,清华大学化学系本硕博,清华企业家协会青创会员,编曲师,音乐制作人,键盘手,吉他手;拥有 100+ 首音乐作品创作及制作经验,作品全网播放量数亿次,有多年音基教育经验。
演讲主题:《AIGC 如何赋能音乐创作与制作》
内容概要:音乐创作与制作本身具备一定的专业性门槛,非专业人士很难借助音乐来表达自我,而 AIGC 的发展也为其带来了另一种可能。本次演讲,我将对音乐产业及用户特点进行简要概述,并分享近期值得关注的音乐 AIGC 技术和产品;接着我会深入讲解 AI 音乐训练数据及算法;最后针对 DeepMusic 产品“和弦派”的设计逻辑进行分享。
58 同城 TEG-AI Lab 负责人、技术委员会 AI 分会主席 詹坤林
詹坤林,58 同城 TEG-AI Lab 负责人、技术委员会 AI 分会主席。硕士毕业于中国科学院大学计算机应用技术专业,在 NLP、推荐领域有十年以上技术和管理经验。从 0 到 1 搭建 58 同城 AI Lab,旨在建设模型领先、敏捷易用的 AI 平台,并打造 AI 标杆应用,助力 AI 技术在 58 同城广泛落地。当前主要负责建设 58 同城垂类大模型、大模型平台、机器学习平台、对话式 AI 平台、智能营销引擎等产品和能力。加入 58 同城前,曾任腾讯高级工程师,从事推荐系统研发。
演讲主题:《生活服务领域垂类大语言模型建设和应用》
内容概要:58 同城生活服务平台包括房产、招聘、汽车、本地服务四大业务,平台连接着海量 C 端用户和 B 端商家,B 端商家可以在平台发布信息,C 端用户可以通过平台找房子、找工作、找家政、买二手车。
我们构建了一套大语言模型开发平台,打造了 58 同城垂类大语言模型"灵犀",并在 B 端商家智能助手场景进行了落地应用,本次分享将做详细介绍。
百融云创 AI 创新负责人 陈昀彰
陈昀彰,百融云创 AI 创新负责人,大数据及机器学习专家,SaaS 和云计算专家,有超过 12 年的相关实践经验,参与过多个大数据和人工智能领域创业团队从成立到提交上市的完整过程。在推荐系统、自然语言处理、机器学习、隐私保护计算、大语言模型等方面有实际产业落地经验。深度参与国内最早的商品和资讯推荐引擎的设计开发,参与推动分布式数据处理、机器学习和知识图谱等技术在国内金融风控领域中得到广泛应用。成功实施过传统产业互联网的全面数智化转型。
演讲主题:《基于产业大模型的金融场景应用创新与落地探索》
内容概要:本次演讲将分为两部分,第一部分讲述对大模型的价值判断,将从模型到应用场景不断渗透;第二部分讲述大模型在百融云的落地实践案例及应用数据
vivo AI 解决方案中心总监 谢伟钦
谢伟钦,vivo AI 解决方案中心总监、vivo AI 产品解决方案负责人、vivo 人文赛道负责人,在人工智能领域拥有深厚的技术背景和丰富的研发经验,曾主导参与开发蓝心小 V、蓝心千询、手语翻译官、vivo 看见等产品功能;专长于 AI 技术在手机端侧的产品应用,具有丰富的经验,并在大模型在手机终端、跨领域发展方面有深入研究。
焱融科技 CTO 张文涛
张文涛,焱融科技 CTO,华中科技大学计算机专业硕士,信通院分布式存储产业方阵 DSIA 核心成员。拥有超过 15 年的大规模公有云存储架构及 AI 存储架构设计经验。深耕分布式存储领域,主导焱融高性能分布式文件存储系统的设计与研发,在 AI/HPC 等前沿领域,积累了丰富的存储架构升级及性能优化经验,并实现业界多个创新性技术突破。
演讲主题:《多云环境下大模型训练和推理的高效存储》
内容概要:从大语言模型到多模态大模型,模型训练和推理需要的算力越来越高,单个数据中心已经无法满足大模型训练所需要的算力要求,采用多数据中心进行训练和推理成为了唯一选择。但是训练数据也在不断增加,在多个数据中心存在多份数据拷贝的成本也越来越大,如何在保证性能的前提下,让数据按需跟随算力进行流转就成为大模型厂商和存储厂商一起要解决的一个难题。
本次演讲将详细介绍焱融针对多数据中心场景下大模型训练和推理的高效存储解决方案,不但能在单个数据中心提供海量小文件场景下的高吞吐高 IOPS 性能,也能够让数据按需跟随算力进行流转。此外演讲还会介绍焱融在大模型训练和推理阶段的 IO 优化手段。
听众将深入了解大模型训练和推理过程中存储的访问特点,同时也将掌握大模型在多云环境下的数据流转策略,确保数据在多个云平台间流畅、安全地迁移与同步;此外,针对多模态大模型处理海量小文件的场景,演讲还将分享性能优化手段,以提升存储系统在处理这类场景时的效率和稳定性。
Zenlayer 行业拓展总监 陈秀忠
陈秀忠(Adam),Zenlayer 行业拓展总监,北邮光纤通信博士,拥有 13 年云计算行业经验。曾在信通院标准所、阿里巴巴和大河云联从事基础网络研究和架构设计。于 2018 年加入 Zenlayer,专注帮助众多出海客户构建全球基础网络,涵盖游戏加速器、跨境电商、公有云、金融、RTC、社交娱乐和智能硬件等领域。在工程师和销售岗位积累了丰富的实践经验和深刻的见解。
演讲主题:《大数据、大算力与大模型驱动下的全球广域网挑战与策略创新》
内容概要:随着 AI 技术的迅猛发展,大数据、大算力与大模型成为推动科技前进的三大核心力量。然而,全球广域网在支撑这一技术革新的同时,也面临着前所未有的挑战。
数据的高效流动与安全保障,算力资源的优化配置与协同工作,以及训练与推理节点间的网络性能优化,这些都是当前全球广域网亟待解决的问题。尽管现有的广域网技术能够为我们提供一定的支持,但长远来看,我们或许需要构建一套面向 AI 的 Global WAN 解决方案,以更好地满足 AI 应用对数据流动、算力组合与网络性能的高标准需求。
Zenlayer 将在此次演讲中深入剖析这些挑战,分享我们在全球广域网领域的最新研究成果与实践经验,并提出创新的应对策略。
智猩猩具身智能技术研讨会嘉宾
优必选副总裁、优必选研究院执行院长 焦继超
焦继超,优必选副总裁、优必选研究院执行院长;北京理工大学博士,美国亚利桑那州立大学访问学者;承担国家重点研发计划、国家 863、国家自然科学基等项目 10 余项,发表论文 50 余篇。
报告主题:《具身智能人形机器人关键技术的进展和趋势》
内容概要:具身智能机器人在国际和国内的发展呈现出显著的技术创新和广泛的应用前景。国际上,情感智能技术的提升使机器人能够更准确地感知和模拟人类的情感表达,进一步提升了人机互动的自然性。在学习与适应性方面,国际研究团队在引入增强学习、迁移学习等技术的同时,推动了机器人在不同环境中更灵活地适应新任务的能力。人形机器人在国际上的发展日益引人注目,各种产品通过具身智能技术模拟人类社交行为,提供更为亲密和有趣的用户体验。
国内方面,人形技术研发和创新在感知技术、运动控制、人机交互等方面都取得了显著进展。在应用领域,国内企业积极拓展具身智能机器人的应用范围,涵盖家庭服务、教育辅助、医疗护理等多个领域。政府对具身智能机器人产业的支持力度逐渐增加,产学研相结合的合作模式推动了相关技术的落地和产业化。
未来发展趋势方面,具身智能人形机器人将更加强调跨学科融合,涉及心理学、神经科学、计算机科学等多个领域,以提高机器人在模拟人类行为和感知方面的真实度和深度。全球范围内的合作与标准制定将成为推动具身智能人形机器人领域可持续发展的关键因素,促使技术的互通与共享,实现全球产业的协同推进。
北京通用人工智能研究院研究科学家、通用视觉实验室负责人 黄思远
黄思远博士是北京通用人工智能研究院(BIGAI)的研究科学家,并担任通用视觉实验室负责人。他在加州大学洛杉矶分校(UCLA)统计系获得博士学位。他的研究旨在构建一个能够理解和与三维环境交互的类人通用智能体。为实现这一目标,他在以下方向做出了贡献:(1)开发可泛化的视觉表征以用于三维重建和语义落地,(2)建模并模仿人类与三维世界的复杂交互,(3)构建擅长与三维世界和人类交互的具身智能体。他的研究发表于四十余篇 CVPR/ICCV/NeurIPS/ICML 等会议及期刊论文,并曾获得 ICML Workshop 最佳论文。在通院,他致力于开发能理解三维物理世界的具身智能体和视觉机器人。
报告主题:《让具身通用智能体理解三维世界》
内容概要: 创造通用智能体是人工智能研究的终极目标。目前,绝大多数智能体缺乏理解三维世界并构建世界模型的能力。如何让智能体理解三维世界并进行推理和交互是要解决的重要问题,也是通向通用人工智能的一个重大瓶颈。这次的分享将主要介绍近期我们几项研究工作是如何尝试解决这些瓶颈问题。
上海人工智能实验室青年研究员 曾嘉
曾嘉,上海人工智能实验室青年研究员,OpenDriveLab 团队核心成员,博士毕业于上海交通大学。主要从事计算机视觉、具身智能、自动驾驶等方面的研究,致力于结合扩散模型与视觉语言模型实现泛化的机器人运动控制。在 CVPR、IEEE T-PAMI、IEEE JBHI 等高水平期刊和会议发表论文 30 余篇。多次担任 CVPR、ICML 等顶会审稿人。 曾获华为 ICT 大赛全国总决赛特等奖、上海交通大学“谷歌杯”学生创业大赛银奖等。
报告主题:《面向具身交互的视觉表征预训练方法研究》
内容概要:近年来,在大语言模型、多模态大模型等新兴技术的加持下,具身智能领域发展迅速。以谷歌发布的 PaLM-E、RT-2 等为代表的具身多模态大模型,在跨场景、跨任务方面提升了机器人运动控制的泛化性。而对于具身多模态大模型而言,良好的视觉表征能力是其理解实时环境的基础,其效果很大程度上依赖于视觉表征的质量与表现力,因此视觉表征预训练方法尤为重要。且考虑到机器人数据的稀缺性,可利用大规模人类视频数据集来提取可泛化特征,以用于视觉驱动的运动控制策略学习。
本次报告将深入讲解最新提出的视觉表征预训练方法 MPI。MPI 通过预测交互帧以及定位交互对象,使模型对于“如何交互”和“在哪里交互”有了更好地理解,增强了编码器捕捉操作过程中的行为模式及交互特征的能力。且在多个下游机器人任务上,MPI 相比于 R3M、MVP、Voltron 等表征学习方法取得了显著的提升。
香港大学在读博士、EmbodiedGPT 一作 穆尧
穆尧,香港大学在读博士,师从罗平教授,共在 NeurIPS, ICML, ICLR, CVPR, IJCAI,IEEE TNNLS 等顶会顶刊发表论文 14 篇, 累计发表文章 20 余篇, 曾获 ICCAS2020 大会最优学生论文奖,IEEE IV2021 最优学生论文提名奖等多项学术奖励, 于 2021 年在清华大学取得硕士学位,荣获香港博士政府奖学金,香港大学校长奖学金,国家奖学金,清华大学优秀硕士毕业生,清华大学优秀硕士论文奖等荣誉称号。研究方向: 具身智能、强化学习、机器人控制和自动驾驶。个人主页:yaomarkmu.github.io
报告主题:《具身智能大模型与通用机器人系统》
内容概要:随着 AIGC 的迅速发展,具身智能与通用机器人系统已成为研究的前沿领域。通过整合大模型、CV 和机器人控制等先进技术,我们正朝着更智能、自主和高效的机器人系统迈进,并在多领域发挥重要作用。
本次报告将聚焦于具身智能大模型 EmbodiedGPT,该模型面向开放世界,拥有具身认知、规划、执行的能力。接着将深入探讨 RoboCodeX 多模态机器人代码生成大模型及 RoboScript 通用机器人代码生成评测平台。RoboCodeX 采用树状结构,将复杂的人类指令细化为多个以对象为中心的操作单元。RoboScript 则致力于通过代码生成,实现机器人操作的快速部署;不仅验证了代码及仿真的准确性,还揭示了不同大模型在处理复杂物理交互时的性能差异。
智猩猩 AI 智能体技术研讨会部分嘉宾
清华大学自然语言处理实验室(THUNLP)博士后 钱忱
钱忱,清华大学自然语言处理实验室(THUNLP)博士后,清华大学水木学者,主要研究方向为自然语言处理、大模型群体智能;合作导师为孙茂松和刘知远教授,曾在人工智能、信息管理、软件工程等相关的国际学术会议或期刊上以第一作者身份发表论文数篇。于 2023 年领导并发布大模型智能体协作式软件开发框架 ChatDev,并多次登顶 Github Trending 榜。
报告主题:《大语言模型驱动的多智能体协作式软件开发》
内容概要:随着人工智能技术的不断发展,未来的软件工程领域将发生根本性变革。在传统软件开发中,团队成员需要相互交流、协商和理解,以共同制定项目方案和编写代码。然而,随着大语言模型的出现,可以利用其强大的自然语言处理和生成能力,实现软件智能体的定制和高效协作。通过智能体间的自主交互,群体成员可以生成代码、提供建议,并协同优化软件源代码。
本次分享内容将探讨自主智能体的设计思路、群体协作框架、经验积累等关键技术,旨在基于大语言模型实现群体智能自动化愿景提供初步思路。
DeepWisdom 合伙人 徐宗泽
徐宗泽,DeepWisdom 合伙人之一,团队 AgentOS 事业部经理。美国佩斯大学企业分析硕士,河海大学(在读)博士;在 DeepWisdom 负责包括电力、零售、金融等多个领域的 AI Infra 的应用落地;拥有数千万级 AI Infra 能源项目实践落地经验,MetaGPT 团队核心成员。
报告主题:《智能体的崛起与 AI 基建的重要性》
内容概要:随着技术的飞速发展,智能体已经成为 AI 领域的热门话题,尤其是 MetaGPT 的出现,使得多智能体协同成为可能。但在这火热的趋势背后,企业如何确保自己的 AI 基建稳固,成为了一个亟待解决的问题。
本次演讲将从智能体的定义与发展历程、MetaGPT 的涨速与影响、多智能体协同的新范式以及 AI Infra 的核心要素四个方面进行深入探讨。听众将了解到智能体的最新发展趋势,理解 AI 基建的重要性,并掌握如何为企业构建稳固的 AI 基建的策略和方法。
腾讯研究科学家 张驰
张驰博士,现就职于腾讯公司担任研究科学家。2021 年博士毕业于新加坡南洋理工大学计算机学院。他的博士研究课题专注于高效低成本的机器学习和计算机视觉算法,目前的研究方向是大模型时代下的多模态模型与 AIGC 模型。曾在 CVPR、ICCV、NeurIPS、TPAMI 等顶级国际会议期刊上发表多篇学术论文
报告主题:《基于多模态大语言模型的 GUI 智能体》
内容概要:如果将语言大模型比喻成一个能思考能交流的大脑,多模态语言大模型则是给大脑赋予了眼睛,让它能够像人一样看到本告我将介绍团队在多模态大模型方向的努力与尝试。我将重点介绍我们最近在多模态智能体(Agent)方向的研究成果 AppAgent:让图文大模型像人一样操作手机 App,并探讨基于 GUI 的 Agent 未来的发展方向与应用前景。
阿里巴巴通义实验室算法专家 李晨亮
李晨亮,现为阿里巴巴通义实验室算法专家。2019 年硕士毕业于北京邮电大学。主要研究方向为自然语言处理,包括预训练语言模型、文本生成、多模态等。曾经在相关领域顶级会议如 ACL、EMNLP、AAAI,ICML 等发表多篇预训练大模型相关论文,包括 AliceMind 系列的 PALM,PLUG,mPLUG,中文 GPT 等系列生成模型。参与多个国际评测和比赛,在纯文本生成、多模态生成等相关评测榜单上多次达到第一,并在多模态 VQA 榜单上首次超越人类水平。负责 ModelScopeGPT 项目,打造大小模型协同的 agent 系统和基于开源大模型的 ModelScope-Agent 框架。
演讲主题:《开源框架 ModelScope-Agent 加速多智能体应用构建》
内容概要:ModelScope-Agent 是一个强大且灵活的开源框架,专门设计给开发者快速打造单智能体和多智能体应用。它除了支持大部分的闭源大模型 API 调用之外,更重要的是结合魔搭开源社区,集成了很多开源大模型和训练微调方案,用户可以快速在开源大模型上做微调进一步提升智能体效果。无论是在模拟环境中进行复杂任务的协作学习还是在实际应用中整合多个智能决策模块,ModelScope-Agent 都提供了必需的工具和接口,从而简化了多智能体交互的开发过程,并充分利用大模型的潜力。基于这个框架,也推出了很多应用参考,如魔搭 GPT,Story Agent 和 APP Fabric 等。
实在智能合伙人&核心算法负责人 欧阳小刚
欧阳小刚,实在智能合伙人&核心算法负责人,清华大学工学学士和工学硕士、硕士研究生学历,36 氪 X-36 Under 36 S 级青年创业者代表;曾任阿里巴巴资深算法工程师,在计算机视觉和自然语言处理领域有多年的深入研究和丰富的项目经验,尤其在光学字符识别、对话机器人构建、文本信息抽取等方向有深入的研究,并拥有多项授权发明专利及国内外核心期刊论文;曾负责云上贵州、珀莱雅、中国电信、中国烟草、平安国际等客户项目的服务落地。
演讲主题:《数字员工再进阶:实在 Agent- 超越自动化,迈向智能化》
内容概要:随着大模型等 AI 技术的崛起,数字员工迎来新的技术革新。
本次演讲,将系统回顾 RPA 到 Agent 数字员工的进阶历程,介绍其如何逐步从简单的流程自动化走向更为智能的决策与交互;并将探讨当下 Agent 在办公自动化场景中的应用可能面临的痛点及挑战。此外,针对这些问题,我们将深入讲解实在 Agent 数字员工的服务架构,思考如何构建高效、灵活且安全的系统,以满足不同企业的需求。同时,我们还将分享实在 Agent 数字员工的典型应用案例,展示其在提升工作效率、优化业务流程方面的卓越表现。
在数字化转型的道路上,实在 Agent 数字员工将是我们不可或缺的重要伙伴。最后,我们将展望可持续研究的方向,思考如何结合人工智能技术的最新进展,推动数字员工技术的不断创新与发展。
中国智算中心创新论坛部分嘉宾
中国移动研究院网络与 IT 技术研究所技术经理、主任研究员 陈佳媛
陈佳媛,中国移动研究院网络与 IT 技术研究所技术经理、主任研究员, 毕业于英国伦敦大学学院,博士学位,先后从事基于 NFV/SDN 的网络转型、 多样性算力、数据中心硬件和新型智算中心等技术领域的研究。
报告主题:《全向智感 OISA - GPU 卡间高速互联技术探讨》
内容概要:随着模型规模向万亿参数演进,模型结构在原有 Transformer 的基础上,引入了扩散模型和 MoE 专家系统。模型技术的迭代催生了底层 GPU 的 Scale up 互联需求快速增长,万卡集群和超节点服务器成为了当前智算设施的讨论热点。本次演讲将聚焦当前 GPU 服务器的演进方向,讨论基于全向智能感知的 GPU 卡间高速互联的关键技术,号召行业共同攻关 GPU 卡间互联架构、协议、底层物理传输介质等核心技术,推动国内 AI 芯片升级。
商汤科技大装置事业群解决方案总监 代继
代继,商汤科技大装置事业群解决方案总监,具备丰富国际、国内国家级重大项目规划建设经验,曾主导多个大型智算中心规划及业务设计。
演讲主题:《大模型时代的 AI 基础设施建设实践》
内容概要:以 GPT4v Sora 为代表的技术突破,以及 Figure01 所展现的产业实践,不断打破技术边界,在未来将持续见证越来越多突破性的产业实践。
本次演讲将介绍大模型技术的发展与新型人工智能基础设施的关系,分享如何通过高效、低成本、规模化的 AI 云基础设施,以及专业的深度学习平台及算法模型体系打造,来引领 AI 创新,助力工业界及学界探索 AI 边界。
听众将了解大模型时代,当前 AI 基础设施建设所面临的挑战,如计算资源不足、模型部署困难等。演讲人将基于自身经验,阐述 AI 基础设施建设的实践探索,分享在实际项目中应用 AI 基础设施的经验和成果,如提升模型性能、降低训练成本等。演讲还将展望大模型时代 AI 基础设施对行业发展的深远影响。
有孚副总裁 商彦强
商彦强博士,有孚副总裁,启思半导体创始合伙人。
中国传媒大学经管学院特聘企业导师,南京邮电大学校外导师兼集成电路校友会副会长,北京市通信行业协会常务理事,中国通信企业协会 AI 专委会副秘书长,中国指挥与控制学会城市大脑专委会常委,2021 年首批工信部新型数据中心推进计划专家、2022 年首届中国算力大会专家,2023 年首届上合组织大数据技术发展论坛专家,2023-2025 华彩杯算力应用创新大赛专委。
商博士专注于前沿硬科技如通信测试技术、智算中心、人工智能、半导体传感器等技术研究与产业运营实践。
演讲主题:《智算中心产业发展挑战及实践探索》
内容概要:纵观全球,随着数字经济的不断深入,算力已经逐渐成为智能时代国家核心竞争力。算力中心作为承载算力的重要底层基础设施,正在迈入“高算力”阶段。AIDC 不仅仅是传统云计算数据中心的延伸,更是为满足人工智能应用需求而进行的一场变革。商博士将呈现给业界这一过程中的关键挑战与产业实践,探索智算中心的新未来。
趋动科技技术总监 张增金
张增金,北京趋动科技有限公司技术总监,杜克大学硕士。拥有逾十年 VMware 研发与营销管理经验,曾于腾讯云及多家外企担任技术研发与市场营销要职。专长包括云计算、敏捷开发及 AI 算力池化,致力于推动技术创新与企业成长。
演讲主题:《软件定义 AI 算力——实现高效低成本的智能计算 》
内容概述:随着人工智能技术的飞速发展,我们正迎来一个决策式与生成式 AI 共存的新时代。本次演讲将深入探讨如何通过算力优化降低 AI 应用的门槛,以及如何应对传统 AI 算力管理中存在的挑战,包括资源的申请、分配、使用和回收等环节。张先生将阐述软件定义 AI 算力的核心理念,并分享如何从根本上革新 AI 算力的管理方式。他将详细解读软件定义 AI 算力如何为模型开发训练,推理及运维等关键环节带来显著效益,提升整体计算效率。 此外,张先生将结合实际企业客户案例,展示如何通过软件定义 AI 算力解决实际问题,实现成本优化和性能提升,推动企业在 AI 领域的持续创新和发展。
奕信通创始人 张侠
张侠 奕信通创始人,清华大学硕士研究生、高级工程师、国家注册建造师、国家注册咨询工程师、数据中心专家组技术委员,在数据中心领域工作超过 10 年,对数据中心,尤其是液冷领域有深度理解与丰富的业务和管理经验。曾任百度项目总监、万国数据建设总监、浩云网络副总裁。
2021 年初创立北京奕信通科技有限公司,公司自研冷板液冷和浸没液冷双技术路线,目前累计交付 200MW 液冷案例,项目遍布国内外。2023 年获数千万人民币的 A 轮融资。
演讲主题:《大模型时代,液冷技术在智算中心的应用与发展趋势》
内容概要:随着数字经济的快速发展,AI 大模型推动算力需求持续增高,对算力基础设施提出了更高的要求,液冷技术在智算中心的应用变得日益重要。当前,以智算中心为代表的服务器集群高耗能现象、高散热表现急需改进与提升。届时,奕信通将与大家一同探讨液冷技术的最新发展趋势和未来更广泛的行业应用。
大会日程
2024 中国生成式 AI 大会的主体会议将在主会场进行,设置为开幕式及三大专场。4 月 18 日上午,开幕式将拉开帷幕,下午将进行大模型专场;AI Infra 专场和 AIGC 应用专场则将分别于 4 月 19 日上午和下午进行。
在分会场,4 月 18 日下午将进行智猩猩具身智能技术研讨会,智猩猩 AI 智能体技术研讨会和中国智算中心创新论坛将分别于 4 月 19 日上午和下午进行。其中,智猩猩具身智能技术研讨会和智猩猩 AI 智能体技术研讨会将面向大会购票用户开放。
报名进入最后阶段,
免费票、标准票持续开放中
大会设有四类电子门票,分别为免费票、标准票、贵宾票和尊享票。其中,对于免费票,在申请后需经主办方审核通过,方可参会;标准票、贵宾票和尊享票均需购买。
目前,贵宾票、尊享票即将售罄,免费票、标准票的申请通道仍在开放中,但名额有限,先到先得。
扫描下方二维码,添加小助手“泡泡”即可进行免费票申请,或购买电子门票。已添加过“泡泡”的老朋友,给“泡泡”私信,发送“GenAI24”即可。
■ 科大讯飞星火 京东 ▍产业大模型案例
■ 商汤日日新、腾讯,昆仑万维 ▍ 金融大模型案例
■ 盘古大模型,中国电信,医联 ▍医疗大模型案例
■阅文大模型,腾讯音乐大模型 ▍ 文娱大模型案例
■知乎,360 大模型,火山引擎 ▍ 教育大模型案例
■ 网易,金山办公大模型 ▍ 更多行业大模型案例
上次介绍大模型航海时代,AI 应用找寻“新大陆”
本文由大模型领域垂直媒体「AI 大模型工场」
原创出品,未经许可,请勿转载。
/
欢迎提供新的大模型商业化落地思路
【免责声明】市场有风险,投资需谨慎。本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。