ChatGPT高算力推动DPU步入快车道,国产DPU蓄势待发-p600算力

电子发烧友网报道(文/李宁远)OpenAI旗下的智能聊天机器人程序ChatGPT自去年年末发布后,在全球范围内掀起了人工智能热潮,热度持续至今。ChatGPT超出人们预期的智能化表现也带火了相关人工智能产业链。

ChatGPT的GPT,本质是生成型预训练变换模型,这种AI模型经过海量的数据训练,才有了高质量的内容输出。ChatGPT的出现,离不开背后庞大的基础算力做支持。高度依赖AI计算能力的ChatGPT也推高了算力需求。

爆火的ChatGPT,高算力需求推动DPU发展

随着众多国内外厂商入局智能聊天机器人行业的竞争,可以预见市场上类似于ChatGPT的机器人程序会如雨后春笋一般冒出来,而全球对于算力的需求也将随着此类技术应用的铺开出现快速的增长。

数据处理芯片DPU,被认为是继 CPU 和 GPU 之后的 “第三颗主力芯片”。DPU是最近几年发展起来的专用处理器大类,是继CPU、GPU之后数据中心场景中重要的算力芯片,能够为高带宽、低延迟、数据密集的计算场景提供计算引擎,是未来处理超算流量和安全网络存储的核心硬件。

DPU市场现在处于百家争鸣的早期发展阶段,各厂商给出的定义有略有不同,这里选择市场上比较主流的英伟达给出的定义,“DPU是集数据中心基础架构于芯片的通用处理器,结合了标准的、高性能及软件可编程的多核CPU,与其它的SoC组件密切配合。同时结合了高性能网络接口,能以线速或网络中的可用速度解析、处理数据,并高效地将数据传输到GPU和CPU”。

相比于CPU和GPU典型的冯诺依曼架构,基于数据流驱动技术的DPU采用的是非冯诺依曼架构,不需要结束一阶段的计算任务后将数据输送到外部的DDR计数器存储,而是可以利用软件可动态重构处理器CGRA技术,合理分配和使用算力的同时,节约数据存储和传输带宽。当CPU算力达到瓶颈,DPU能够帮助CPU卸载低效应用的算力,当GPU专注数据加速计算,DPU可以帮助进行数据解析和处理提高数据接发效率。

在ChatGPT高算力需求的推动下,DPU开始进入发展快车道。

DPU市场将迎来爆发式增长,国产DPU蓄势待发

根据据赛迪顾问《中国DPU行业发展白皮书》对全球以及中国DPU市场的统计,预计到2025年全球DPU产业市场规模将超过245.3亿美元,复合增速达51.73%。而中国市场预计到2025年DPU产业规模将超过565.9亿元,复合增速达170.6%。

白皮书中特别提到,中国DPU市场在2022-2023年将会有爆发式的增长,而全球市场的爆发式增长阶段将会出现在2023-2024年。

DPU在行业内其实早已有了雏形,早在2013年,Amazon就研发过一款名为Nitro的轻量化Hypervisor配合定制化硬件,能将虚拟机的计算和 I/O子系统分离开来。直到2020年英伟达将基于Mellanox的Smart NIC命名为DPU并将其定位为继CPU和GPU之后数据中心的“第三颗主力芯片”,才算真正走到大家眼前被重视起来并掀起行业热潮。

根据赛迪顾问《中国DPU行业发展白皮书》中的数据,2020年国内的DPU市场仅有3.9亿元。而到了2021年,国内市场规模迅速发展到75.3亿元,可见这一赛道的火热。

从目前入局的厂商来看,英伟达、Intel、AMD、Marvell、Broadcom、Amazon、Microsoft等国际厂商在近年来都有DPU或相似架构产品发布,入局早具备一定的先发优势,在底层能力上无疑要领先国内厂商。

国内华为,阿里等老牌厂商也在近几年针对服务器需求自研DPU,主要功能偏向于数据,存储与安全方面。同时国内还有一批初创企业加入了DPU赛道,如云豹智能、星云智联、芯启源、云脉芯联、中科驭数、大禹智芯等。

主要DPU厂商动态

英伟达:先进BlueField系列占据行业高点

在全球DPU市场,英伟达占据了超半数市场份额。目前英伟达的BlueField系列DPU已经发展至第三代,BlueField-3 是首款以线速处理软件定义网络、存储和网络安全的 DPU,速度可达400 Gb/s。BlueField-3可以搭载最多16个Armv8.2+ A78 Hercules核心,包含220亿个晶体管,拥有16GB板载DDR5显存,能够在I/O路径中提供强大的计算能力和多种可编程加速引擎。相比BlueField-2系列8 颗ARM A72 CPU 内核,处理性能提升了近10倍。

而BlueField-4根据英伟达官方消息,有望在2024年推出。除此之外,英伟达还将DPU与 Ampere架构的强大功能结合成融合加速器,进一步为AI驱动的工作负载带来出色的性能和强大的安全性。

英特尔:预计2024年推出400G IPU,2025年推出800G IPU

英特尔的IPU被业界视为英特尔版本的DPU,同样可以加速网络基础设施,释放CPU内核,实现应用程序性能的提升。E2000是目前英特尔处理性能最高的IPU,是英特尔利用从多代FPGA SmartNIC 中积累的经验和谷歌共同设计的,拥有多达16个Arm Neoverse N1核心,具备高度可编程性的数据包处理引擎。

从去年Intel Vision 2022大会上公布的最新的IPU路线图来看,2024年400 Gbps IPU有望面世,800G IPU则定在2025年。

芯启源:布局下一代7nm以下DPU产品

芯启源是目前国内唯一一家能够提供基于SoC架构的国产化25G智能网卡的供应商,已经推出了量产的DPU芯片4000及3800系列产品,并且已实现商业化落地。芯启源的下一个布局是7000系列DPU,根据相关信息,下一代DPU芯片将采用7nm以下工艺,能达到400G的吞吐量,具有600Mpps,RDMA/RoCEv2,国密SM3/SM4等的功能及性能。

星云智联:实力强劲的国内初创DPU芯片公司

星云智联是一家专注于数据中心通信互联架构、DPU芯片和解决方案研发的国内初创公司,其自主研发的NebulaX D1055AS是一款50G DPU芯片。NebulaX D1055AS在高速数据转发上,以纯硬件方式实现对数据流处理,以获得高吞吐量和低延时性能,在国内DPU赛道上有着强劲的实力。

云豹智能:DPU SoC有望今年量产

云豹智能主张软件定义芯片,此前发布过基于FPGA版本的DPU云霄,在可编程性上非常灵活。目前云豹智能的第一款DPU SoC正在设计研发阶段,根据相关消息,该DPU SoC有望在今年量产。

中科驭数:基于自研KPU架构布局DPU

中科驭数的KPU架构是基于中科驭数首创的软件定义加速器技术路线而研发的领域专用技术芯片架构,并基于该架构打造了首个拥有网络数据库一体化加速功能的DPU芯片,能提供高效能的算力支撑。在目前的产品进度上,根据相关报道,第三代12nm 400G DPU芯片的研发迭代已近尾声。

ChatGPT高算力推动DPU步入快车道,国产DPU蓄势待发-p600算力

写在最后

DPU的诞生就是为了应对数据量以及计算复杂性的指数级增长,在ChatGPT将算力需求再推上一个新台阶后,DPU有力支撑起了算力效率的提升,在原本火热的市场里又一次加快了发展速度。

免责声明:文章内容来自互联网,本站不对其真实性负责,也不承担任何法律责任,如有侵权等情况,请与本站联系删除。
转载请注明出处:ChatGPT高算力推动DPU步入快车道,国产DPU蓄势待发-p600算力 https://www.yhzz.com.cn/a/4306.html

上一篇 2023-04-10 21:31:00
下一篇 2023-04-10 21:41:01

相关推荐

联系云恒

在线留言: 我要留言
客服热线:400-600-0310
工作时间:周一至周六,08:30-17:30,节假日休息。