欲与英伟达决高下,英特尔推中国定制版AI芯片

时间:2024-11-02 01:39:36 来源: 分类:知识

21世纪经济报道记者倪雨晴 北京报道 AI芯片的欲英战争正愈演愈烈。

7月11日,伟达英特尔面向中国市场推出了AI芯片 Habana Gaudi 2 ,决高Gaudi 2直接对于标英伟达GPU的下英芯片100系列,欲争取AI算力市场的特尔推中宝座。

家喻户晓 ,国定当初GPU资源紧缺,制版英伟达的欲英100系列在国内禁售 ,而百模大战之下算力的伟达需要还在飙升。对于中国市场而言,决高之后急需AI芯片“解渴” ,下英芯片对于英特尔而言 ,特尔推中眼下正值算力紧缺的国定窗口期,也是制版侵略的绝佳机缘 。

英特尔也夸张 ,欲英Gaudi 2芯片是专为磨炼狂语言模子而构建,接管7纳米制程,有24个张量处置器中间  。事实上 ,去年英特尔就已经在外洋宣告了Gaudi 2 ,这次在中国推出的是“中国特供版”。

由于列国的进口操作限度  ,外界主要体贴的是AI芯片在中国市场的提供可不断性 。对于此 ,英特尔公司实施副总裁 、数据中间与家养智能事业部总司理Sandra Rivera在接受21世纪经济报道记者采访时做出了确定的回覆 。

Sandra Rivera说道:“这张卡也是中国定制版的产物 ,对于进口概况是反对于中国的客户是不任何下场的。英特尔确定是正当合规地在中国不断反对于咱们的客户,不论是Gaudi 2概况是未来的Gaudi 3 ,咱们确定是在正当合规的情景下做出一些中国定制的产物 ,以知足中国的客户的需要 。”

同时,芯片的功能并无打折 ,她展现:“在收集速率上 ,(中国版)以及国内版比照 ,是从24个网口酿成21个网口 ,可是部份功能仍是根基不同的  。”

“中国定制版”瞄准大模子  

随着大模子的一劳永逸,英特尔在近多少个月内环抱着Gaudi2不断妨碍优化。

Sandra Rivera介绍道  ,在功能上 ,凭证机械学习与家养智能凋谢财富同盟MLCo妹妹ons在六月尾宣告的AI功能基准测试MLPerf Training 3.0服从展现,Gaudi 2是除了英伟达产物外 ,仅有能把MLPerf GPT 3.0模子跑起来的芯片。

在宣告会现场,英特尔也直接将Gaudi2以及英伟达的A100妨碍比力,其野心可见一斑。凭证英特尔宣告的数据 ,从合计机视觉模子磨炼到1760亿参数的BLOOMZ推理,Gaudi 2每一瓦功能约A100的2倍,模子磨炼以及部署的功耗飞腾约一半。

同时,英特尔高管还介绍道 ,当初比照A100,Gaudi 2价钱更有相助力 ,且功能更高 。接下来到9月,接管FP8软件的Gaudi 2估量可能提供比H100更高的性价比。

部份而言 ,除了芯片 ,在这次宣告会上 ,英特尔揭示了一系列反对于大模子的算力处置系统 ,接下来详细的落地运用以及产物迭代情景也受到关注  。

一方面,当初在中国市场上 ,英特尔已经以及浪潮信息、新华三、超聚变等国内主要的效率器厂商相助 ,其中 ,浪潮信息的NF5698G7是专为面向天生式AI市场的新款AI效率器,反对于8颗OAM高速互联的Gaudi2减速器  ,

而在终端客户方面  ,Sandra Rivera展现:“中国市场对于家养智能处置妄想的需要颇为单薄  ,咱们正在与简直所有传统客户洽谈。咱们的云效率提供商 、通讯处事提供商都是企业客户,因此对于家养智能处置妄想有着强烈的需要 。”

另一方面,在产物道路上,英特尔近些年不断夸张XPU,即多样化、多组合的异构合计。在AI相关的产物线上 ,既有集成AI减速器的CPU处置器、有GPU产物 、以及Habana Gaudi系列代表的ASIC规范AI芯片。

Habana Labs建树于2016年 ,主要研发倾向为家养智能、深度学习合计等,守业早期就患上到了英特尔的投资,而后在2019年12月以20亿美元被其正式笼络  。

对于GPU以及AI芯片的组合,Sandra Rivera泄露 :“Gaudi是一总体工智能减速的专属产物 ,在英特尔产物里,假如是针对于大模子这个使命负载 ,它是功能最佳、最优的一个产物。明年咱们还会有下一代产物Gaudi 3宣告。在2025年的时候,咱们会把Gaudi的AI芯片跟GPU道路图合二为一 ,推出一个更整合的GPU的产物 。”

算力市场争霸减轻

大模子的火热还在不断拉动AI芯片的需要 。

Sandra Rivera见告21世纪经济报道记者:“在4月份回顾一季度的情景时,咱们看到了种种家养智能带来的芯片需要 ,搜罗Gaudi在内,需要至少翻了两倍以上 。”

TrendForce集邦咨询向21世纪经济报道记者提供的数据展现,目上主要由搭载NVIDIA A100 、H100 、AMD MI300 ,以及大型CSP业者如Google、AWS等自主研发ASIC的AI效率器妨碍需要较为单薄 ,2023年AI效率器出货量(搜罗搭载GPU、FPGA 、ASIC等)出货量预估近120万台 ,年增率近38%  ,AI芯片出货量同步看涨 ,可望妨碍突破五成 。

芯片厂商们也在AI规模开足马力。英伟达不用多言,之后不论是100系列仍是800系列,都颇为紧缺 ,在AI芯片市场上占当先发优势;在6月中旬,AMD推出了新一代AI芯片 、数据中间CPU  、以及DPU,其中AI芯片Instinct MI 300X ,直接对于标英伟达H100;此外,google、亚马逊、baidu等大厂也都在自研AI芯片,在算力市场上的相助维度愈加丰硕 。

而除了硬件之外 ,软件也同样关键  。好比,当初大部份AI芯片都绕不开英伟达的CUDA平台  ,CUDA建树了一套软硬件间的开拓尺度。若何从CUDA迁移 、若何建树自己的优势生态都是挑战者的紧张课题 。

对于软件生态的相助 ,Sandra Rivera展现:“软件开拓概况是开拓者生态,着实是英特尔多年的一个刚强 ,在全部数据中间规模中的软件生态中 ,一个是x86的软件生态 ,另一个是CUDA。而且咱们留意到 ,随着越来越多的公司愿望运用家养智能 ,软件生态零星也正在减速开掘更多硬件潜能 ,以大幅后退花难题  。”

她进一步谈道 :“英特尔愿望能在多种语言情景中 ,可能提供更啰嗦的运用 。经由软件 、库以及工具提供一种模块化的措施 ,来优化并减速跨多种架构的异构负载 。尽管在家养智能概况是AI运算的时候 ,简直良多人在用CUDA ,可是大部份开拓者不会做那末底层的开拓,他们是在一个比力高的框架 ,好比说在PyTorch、TensorFlow下面去立异 。”

Habana Labs首席经营官Eitan Medina进一步向21世纪经济报道记者指出:“在Gaudi2以前 ,咱们已经有一代产物,在软件上也做了好多少年的积攒 ,底层的软件库都已经开拓好了  ,咱们愿望闪开拓者可能在最下层的20%的比例可能做他的开拓,这里的开拓以及CUDA并无那末直接的分割关连 。”

Gaudi系列作为英特尔AI的一支旗舰,外界也刮目相待Gaudi 2在实际运用中的功能展现、算力实力 。从硬件迭代到软件生态,AI芯片的相助故事还将不断。

(作者 :倪雨晴 编纂:张星)