①中科馭數(shù)第三代DPU芯片K2-Pro正式發(fā)布,產品主要面向未來數(shù)據(jù)中心和云原生環(huán)境并進行了定制優(yōu)化; ②在算網融合的技術發(fā)展與應用下,DPU等一類用于加速各種數(shù)據(jù)處理的產品重要性凸顯,中科馭數(shù)CEO鄢貴海表示,網中有算這件事情,只有DPU可以干。
《科創(chuàng)板日報》6月20日訊(記者 郭輝) 國內首顆量產全功能DPU算力芯片面市。
昨日(6月19日),中科馭數(shù)第三代DPU芯片K2-Pro正式發(fā)布。K2-Pro是目前國內首顆量產全功能DPU算力芯片,產品主要面向未來數(shù)據(jù)中心和云原生環(huán)境并進行了定制優(yōu)化。
據(jù)了解,在數(shù)據(jù)處理方面,K2-Pro包處理速率可達80Mpps,復雜服務網格性能從400微秒降至30微秒以內。通過PPP、NP內核及P4可編程架構,K2-Pro能夠實現(xiàn)業(yè)務與同構算力、異構算力靈活擴展;在DPU復雜場景下,能耗較上一代降低30%。
在算網融合的技術發(fā)展與應用下,DPU等一類用于加速各種數(shù)據(jù)處理的產品,重要性凸顯。然而與之伴隨的是,DPU這一產品概念在近幾年發(fā)展中受到不少爭議,比如DPU與智能網卡功能與定位是否重合,英偉達等廠商對DPU的公開討論越來越少是否意味著被戰(zhàn)略性放棄等。
中科馭數(shù)CEO鄢貴海表示:“網中有算這件事情,只有DPU可以干,這樣的負載類型不是單純靠CPU能夠處理?!睋?jù)介紹,為應對行業(yè)趨勢,中科馭數(shù)對DPU的定義跟設計也有相應變化,不再將DPU視為單一芯片,而是從先進芯片架構、高兼容性的軟件生態(tài)、低成本部署及業(yè)務驗證等三個維度重新定義其價值。
關于DPU在新的發(fā)展階段的新思考,在發(fā)布會后,中科馭數(shù)CEO鄢貴海、CTO盧文巖、高級副總裁張宇接受了《科創(chuàng)板日報》在內的媒體采訪。
國產DPU概念需要重新被定義
“DPU是進行算網融合的關鍵組件”。鄢貴海表示,如今DPU應用絕對不僅是卸載部分CPU負載那么簡單,“有些任務——比如處理安全上的業(yè)務、做分布式安全機制等,不僅GPU干不了,CPU本身也不太能有效處理,而在DPU上做這件事情就會非常簡單”。在中科馭數(shù)看來,DPU功能不僅需要提高算網的計算集群效率,同時還要求能夠提高計算集群運維水平、提高集群整體算力規(guī)模。
算網融合是以通信網絡設施和計算設施的融合發(fā)展為基礎,通過計算、存儲及網絡資源統(tǒng)一編排管控,滿足業(yè)務對網絡和算力靈活泛在、彈性敏捷、智能隨機應用需求的一種新型業(yè)務模式。
從兩年前東數(shù)西算國家戰(zhàn)略的引入,逐步到去年年底算力基礎設施高質量發(fā)展行動規(guī)劃發(fā)布,到今年各地智算中心全面鋪開,算網一體化模式已深入眾多產業(yè)的技術迭代和應用發(fā)展的大節(jié)奏之中。
其中,DPU也從以前服務器板卡的產品形態(tài)進一步發(fā)展,時至今日承擔了越來越重要的算力來源支撐。
鄢貴海表示,DPU需要被重新定義,不能單純只搞芯片這一件事情。DPU本身功能,如果還是與原來狹義理解的DPU負責卸載CPU負載的視角去看待,顯然太過于局限。就像現(xiàn)在看計算機系統(tǒng),應該要看整體的分布式集群性系統(tǒng)一樣。“現(xiàn)在DPU也要逐步建立起軟件的護城河,還要做好平臺上門,用最低的成本讓客戶接入DPU規(guī)?;渴鹋c業(yè)務驗證,讓DPU軟硬件技術在云里面落地生根。”
民生證券研究報告觀點認為,得益于智能網卡方案的逐步成熟,疊加全球通用服務器出貨量的穩(wěn)定增長、L3以上級別智能駕駛汽車的技術落地、工業(yè)控制領域的需求增加等原因,全球、國內DPU產業(yè)均有望實現(xiàn)快速發(fā)展。
DPU未來應用需進一步融入高算力節(jié)點
DPU的技術和功能價值過去也得到了英偉達這樣的行業(yè)巨頭認可。2020年,英偉達在GTC戰(zhàn)略發(fā)布中將DPU定義為“第三顆主力芯片”。基于GPU、DPU和CPU三種新一代架構構建的NVIDIA加速計算平臺,英偉達目標指向重塑AI時代的數(shù)據(jù)中心。
據(jù)了解,DPU由基礎網卡進化而來,具有獨立計算單元是DPU相較于普通網卡的主要特征,可通過ASIC/FPGA/SoC等技術實現(xiàn)。從核心功能來看,DPU主要是從CPU上卸載關鍵網絡、存儲、安全任務,以降低CPU的運算壓力,從而提升整個數(shù)據(jù)中心的運行效率。
然而近兩年DPU的定位和功能也受到一定挑戰(zhàn)。最直觀的感受是,英偉達如今已經很少公開單獨談論DPU了,而且國內涌現(xiàn)出來的主打DPU產品的廠商,也不如GPU/CPU的項目多。
鄢貴海認為,其中的緣由與英偉達自身的技術概念營銷及產品方案策略有關,國外芯片巨頭對其DPU產品形態(tài)和定位的調整依然值得關注。與此同時,在“大廠弊病”之下,這些巨頭產品迭代節(jié)奏降緩,對于國內廠商來說反而是機會。
“2021年DPU熱度達到高峰,到2022年行業(yè)形成聚力,再到2023年、2024年迎來產品大規(guī)模應用的關鍵階段,其間英偉達逐步把原來狹義的DPU剝離了出來,并將DPU概念轉移到到NV-Link上,只是不把NV-Link叫DPU,這更多是一種概念的營銷?!?/p>
鄢貴海表示,英偉達在推產品時,基本是以集群的形式、以完整的高算力節(jié)點來作為產品形態(tài)。在DPU產品方面,英偉達并沒有加以弱化,DGX里面仍然在部署DPU系統(tǒng)。
端側加上DPU和已經非常完善的CX系列高性能網卡,“可以說全都是英偉達的王牌,但不會像之前一樣全都亮出來”。鄢貴海認為,英偉達的一體化技術,重型行業(yè)游戲規(guī)則,對國內未來做算力或大規(guī)模芯片相關的廠商來說,是一個非常好的指向。
除英偉達外,英特爾與AMD兩家芯片巨頭亦有DPU項目的布局。其中,英特爾基礎設施處理器(IPU)定位與DPU類似,是一種可編程的網絡設備,可以管理存儲流量,減少時延,同時通過無磁盤服務器架構有效利用存儲容量,能夠使云和通信服務提供商減少在CPU方面的開銷,充分釋放性能價值。AMD則在2022年以19億美元收購Pensando并正式進軍DPU領域,Pensando公司CEO和團隊加入AMD的數(shù)據(jù)中心解決方案部門。
“英特爾IPU從定位上來看要更高,直接把基礎設施作為DPU的定義其實是極其準確的。但是英特爾作為行業(yè)內的‘大象’,專屬權力就是慢?!臂迟F海表示,雖然IPU定位很好、基礎也不錯,但是迭代非常慢,而AMD收購初創(chuàng)公司也有可能直接減慢其DPU項目發(fā)展?!皩︸S數(shù)來說,DPU的定義是集眾家之長,真正還原DPU之于整個計算系統(tǒng)的意義?!?/p>
DPU的功能和應用范圍都要多過傳統(tǒng)網卡
智算中心的多點全面鋪開也讓智能網卡或以太網物理芯片的需求,成為業(yè)內眾多廠商的創(chuàng)新和產業(yè)化競爭的焦點。目前浪潮、新華三、博通等廠商均有相關布局。
DPU的產品概念和技術特點,也被直接拿來與智能網卡進行對比。究竟孰優(yōu)孰劣、是否會被取代,受到業(yè)內的關注和討論。
面對爭議,鄢貴海接受采訪時認為,DPU不會被取代,其獨特優(yōu)勢反而會在未來的智算中心建設中迎來需求放量。
“所謂的智算中心網卡,其功能來說在智算中心中要解決的核心問題是GPU之間、GPU跟存儲之間的通信,但在解決GPU跟CPU路徑中的帶寬和數(shù)據(jù)流量的問題時沒有那么顯著。”鄢貴海表示,網卡主要解決網絡數(shù)據(jù)進入后通過PCIe設備接入主機的過程,并不會對高帶寬的要求進行特殊處理,這種情況下傳統(tǒng)網卡不太適用于未來智算中心的網絡接口卡位置。
在鄢貴??磥恚珼PU要支持類似于GBR、GBS的負載,其實就是給GPU之間、GPU和CPU之間的通信找到一條快速通路,這一通路要搭建在全新的網絡設備接口上,而全新的網絡接口就是DPU。因此,DPU的功能和應用范圍都要多過傳統(tǒng)網卡,“未來智算中心里面DPU用的量不僅不會少,還會越來越多?!?/p>
“當然,數(shù)據(jù)中心網絡結構復雜,通常網絡不可能只有一套”。鄢貴海也表示,未來不同網絡可能要用不同的功能,比如運維、管控、監(jiān)控用傳統(tǒng)以太做,智算靠無損RDMA的網絡?!斑@種情況下,在智算中心中有用傳統(tǒng)網卡的需求,但是更大的需求、增長更快的需求,還是在高速網絡、高速的RDMA及無損網絡上。”