“大模型+大算力”助力汽车智能化——访商汤科技联合创始人王晓刚
“随着数字经济时代全面开启,算力已经像水、电一样,渗透到生产生活的各个领域。”工信部党组成员、副部长张云明此前表示,算力已成为当下新的生产力形式。尤其是在“百模大战”愈演愈烈的当下,各行各业对算力的需求已达到前所未有的高度。随着大模型时代的到来,算力究竟如何满足各行各业的需求?汽车产业如何更好利用算力?近日,商汤科技联合创始人、首席科学家,绝影智能汽车事业群总裁王晓刚在接受《中国汽车报》记者专访时表示,通用人工智能的发展将推动算力需求量出现爆发式增长,汽车智能化也将出现质的飞跃。
商汤科技联合创始人、首席科学家、绝影智能汽车事业群总裁王晓刚
算力需求迎来大爆发
目前,我国算力总规模居全球第二,保持30%左右的年增长率。根据中国信息通信研究院测算,2022年我国算力核心产业规模达1.8万亿元。算力每投入1元,就会带动3~4元的GDP增长。据预测,到2025年,数据中心、云计算、人工智能市场规模总计将突破2.5万亿元,算力核心产业规模将不低于4.4万亿元,关联产业规模可达24万亿元。算力已然成为拉动中国经济增长的核心引擎之一。
“就目前的发展趋势,无论是在训练方面还是推理方面,未来对算力都有更高要求和更大需求。”王晓刚表示,大模型的实现需要强大的算力来支撑训练和推演过程。训练大模型往往需要处理庞大的数据集,包括文本、图像、视频等,需要超大规模算力提供强大的计算能力与存储容量。
在王晓刚看来,中国在人工智能领域布局较早,具备先发优势,已成为发展通用人工智能和大模型最重要的市场之一。与其他地区相比,中国算力需求量将出现爆发式增长。有鉴于此,加快算力基础设施建设、着力关键核心技术攻关、推动算力高质量发展成为我国算力行业发展的当务之急。2021年,工信部等部门联合印发《全国一体化大数据中心协同创新体系算力枢纽实施方案》,批复同意在8个地区建设10个国家算力枢纽节点,出台《新型数据中心发展三年行动计划(2021~2023年)》,持续优化全国算力整体布局。
在算力基础设施的布局上,商汤科技可谓是“始于微末,发于华枝”。“早前,我们在算力基础设施建设上下决心加大投入,很多人不能理解,如今大家已经能够清楚看到这些基础设施的真正价值。”王晓刚告诉记者,基于对人工智能发展趋势的预判,商汤科技早在创立之初就开始布局算力中心,2018年就已经在全球建设超过20个数据中心,并筹划建立超大规模的数据中心。2022年初,商汤科技的人工智能计算中心(AIDC)正式启用,是目前亚洲最大的智能计算平台之一。以商汤AIDC为算力基座,商汤科技历时5年打造了商汤大装置SenseCore,包含27000块GPU,可输出5000 Petaflops算力,可支持20个千亿参数超大模型同时训练。
商汤科技人工智能计算中心(AIDC)
“打造算力基础设施的过程并非简单的算力叠加,而是打磨出一整套支持大模型软硬件系统的基础设施。我们通过各种优化,千卡并行利用率现已超90%。”王晓刚直言,正是基于提前布局,商汤科技才能在大模型盛行的当下实现快速发展。目前,商汤大装置不仅支持其自身的大模型训练项目,还与多家企业达成大模型训练方面的合作,处于供不应求的状态。
大算力成汽车智能化基座
作为汽车智能化领域的“角斗场”,中国汽车产业无疑引领了全球汽车产业智能化浪潮,算力大战也在中国市场上愈演愈烈。搭载算力更强的芯片,已然成为各大车企车型规划的关键要素,甚至成为营销热点。在王晓刚看来,无论是智能座舱抑或是智能驾驶,想要实现“真智能”,都离不开算力的支撑。
一般而言,算力可分为终端算力和云端算力两种。近年来,由于各大车企争相开始硬件方面的军备竞赛,“拼算力”时代到来。随着多样化的智能化功能率先在高端车型落地,如今各大车企在终端算力的竞争中开始考虑性价比,向中低端车型普及智能化配置,力求将算力成本下压。
在云端算力上,王晓刚指出,大模型的出现给汽车智能化带来了质的提升。“智能座舱此前更多提供的是单点的功能,基于固有规则触发,智能化体验并不算好。智能驾驶同样如此,决策、规划模块还是基于规则。这让人感觉是‘假的’人工智能。”王晓刚告诉记者,大模型的出现将给智能座舱、智能驾驶带来前所未有的变化。在智能座舱上,大模型将具有更加强大的推理、决策、规划能力,座舱大脑将以往离散的、单点的功能串联起来,并打破原有的基于规则的限制,具备强大的逻辑推理能力。在智能驾驶上,则可以实现端到端一体化,让智能驾驶体验更像“老司机”。
绝影:驾舱云三位一体,打造智能汽车时代的通用人工智能核心供应商
对汽车“真智能”的美好期盼,都离不开大算力的支撑。王晓刚表示,在智能驾驶上,未来大模型的使用要求车端必须有大算力支撑,仅靠调用云端算力较难满足实际需求;智能座舱方面,目前来看还需调用云端算力,但随着需求逐渐收敛,也会出现像座舱大脑类似的终端芯片来支撑智能座舱大模型。此外,在训练侧,无论是智能座舱还是智能驾驶,其所依赖的大模型均需超大规模算力作为支撑。“训练一次千亿级大模型,需要上千张卡,这对我们的算力提出了前所未有的需求。”他说。
大模型产品有望今年量产落地
加码布局算力,实则是为争相涌现的大模型应用做足准备。今年5月发布的《中国人工智能大模型地图研究报告》显示,目前,中国10亿参数规模以上的大模型已发布了79个。作为其中佼佼者,2019年,商汤科技就首次发布10亿参数视觉大模型。2022年,商汤科技发布320亿参数视觉大模型,是世界上迄今为止最大的视觉模型。今年4月,商汤科技还正式发布“日日新SenseNova”大模型体系,现已实现多方位全面升级,一系列大模型产品更新和落地成果加速显现。
据介绍,商汤“日日新”大模型共覆盖计算机视觉、自然语言处理、多模态、AI内容生成和决策智能等多个领域,正以较快的速度实现迭代和演进。商汤商量SenseChat大语言模型如今已迭代到2.0阶段,多项能力全面提升。在全球三大权威语言模型测评基准MMLU、AGIEval、C-Eval中均表现突出,领先ChatGPT,部分已十分接近GPT-4水平。在多模态方面,今年3月商汤科技开源30亿参数的“书生2.5”大模型,如今已达200亿参数规模。“依据多模态大模型,用户可以用自然语言定义各种开放式任务,在智能汽车、智能制造等方面应用广泛。”王晓刚表示。此外,商汤AIGC文生图模型对标Midjourney,仅需上传十余张照片便可得到专属模型。
商汤科技推出“日日新SenseNova”大模型体系
聚焦大模型在汽车智能化上的落地,王晓刚表示,大模型成果将率先在智能座舱领域实现商业化,并最快于今年年内量产落地。目前,商汤绝影正与几十余家车企密切对接,加快大模型在智能座舱领域的量产。“在智能座舱方面,大模型的量产落地速度还是非常快的,将会基于现有硬件设施,通过OTA把相关功能加载进去。”
在智能驾驶上,由于自动驾驶技术栈较为复杂,对算力也提出更高要求,大模型的落地周期会更长。不过,作为下一轮产业竞争的关键点,多家车企、自动驾驶公司均已开始自动驾驶大模型方面的布局。今年4月,商汤科技联合上海人工智能实验室等提出首个感知决策一体化的端到端自动驾驶大模型UniAD,开创以全局任务为目标的自动驾驶大模型架构先河。6月,相关论文获得了全球顶级计算机视觉会议CVPR 2023最佳优秀论文,是CVPR会议历史上首篇以自动驾驶为题材的优秀论文。
大模型将率先在智能座舱领域实现落地,打造有温度、更懂你的出行管家
王晓刚强调,由于用户诉求点、需求维度较为分散,目前大模型在汽车上的应用还相对发散。为此,应当围绕实现的难易程度、给用户带来的市场价值两大维度推进大模型在汽车产业的落地。在应用初期,用户需求相对发散,首要任务是先实现量产,让终端用户体验到大模型带来的真正价值。随着越来越多产品落地,大模型给用户带来的价值点会逐渐收敛。在这一阶段,可以通过甄别更具价值的功能,以及对模型的不断优化,来降低调用成本。“尽管现在大家利用大模型还是相对孤立、发散的,但随着价值点逐渐收敛,基于多模态大模型可以形成完整的驾舱融合生态,这是大模型能够给车舱带来的最大价值点。”他说道。