随着ai大模型的发展,人工智能训练任务中使用的算力呈指数级增长,催生了算力方面更高的需求。面对agi(artificial general intelligence-通用人工智能)时代算力的爆发式增长需求,人们不禁思考:在这一轮ai大模型的“军备竞赛”中,算力是否是最核心的基础要素?agi时代对算力的需求该如何衡量?agi的发展需要什么样的算力基础呢?
带着以上问题,1月25日,联想首档数字人与真人对话栏目《ai talk》第三期正式上线,本期邀请到联想集团副总裁、中国区基础设施业务群总经理陈振宽的“数字分身”与《科技正能量》创始人郑凯展开一场“数字对话”,围绕“agi时代,多少算力才够用?”这一主题,共同探讨agi时代算力领域的新机遇。
*数字人模型由联想thinksystem st650 v2服务器训练完成
人工智能要发展,离不开三个关键要素:算力、算法和数据。进入大模型时代,算力增速变成了每年增长上百倍,从去年算力的规模来看,到今年已经达到268eflops。在大模型应用场景的广泛开拓与深入发展的背景下,智能算力规模超过通用算力,并且未来5年的增速已经达到了52%。所以过去一年,众多企业纷纷开始抢占算力资源,以赢得市场先机。
陈振宽认为,“大模型训练依靠的是整个算力集群,包含整套的服务。例如分布式训练的构建;不同节点显卡的并行作业;节点内和节点间的通信;ai存储、高速网络,异构算力调度等等。突破算力这一关,才算拿到人工智能时代的‘船票’。”
联想集团副总裁、中国区基础设施业务群总经理陈振宽的“数字分身”
面对agi时代日益增长的算力需求,联想做出三方面的战略调整:首先,算力基础设施将全面支持ai;其次,在基础设施领域的研发投入至少会有一半投入在ai领域;第三,联想将持续打造全面的ai技术以覆盖全域的ai应用,真正落实ai导向的基础设施。去年年初,联想发布了首个本地化品牌“联想问天”,以“本地创新 敏捷高效”的内涵,延续着联想服务器“三高一低”的品质保障,成为联想ai导向基础设施的主要组成部分之一。
从训练到训推一体,再到推理的ai全场景,联想拥有完善的ai服务器产品矩阵。在刚刚结束的联想算力基础设施新品品鉴会上,联想重磅发布了三大系列新品,包括搭载最新第五代英特尔®至强®可扩展处理器的联想问天wr5220 g3服务器、首次面向国内中小企业的联想问天wr3220 g2服务器,以及面向边缘场景的联想智能边缘云和边缘超融合一体机系列,进一步丰富了联想算力基础设施从云到边缘场景的覆盖,并完善了联想“全面覆盖、性能领先、绿色低碳”的算力设施产品组合。
过去,十亿级、百亿级的模型训练已经逐渐成熟,包括科学研究、机器视觉等等应用场景。但对于千亿级参数大模型的训练,以及后续所需的精调和推理,对算力的需求将会方兴未艾。陈振宽认为,“agi时代的算力需求显然无法用‘够不够’这个词来定义,而应该是‘是否好用’或者‘是否用到刀刃上了’来形容。未来,联想将会补齐所有对于大模型的训练、微调、推理、边缘推理等等相关的硬件,以及异构智算平台等软件平台,与客户共同站在算力需求急速增长的大潮潮流之上。”