從計算中心走向算力網絡 人工智能悄然“豹變”
2022-03-16 11:44:26? ?來源:人民郵電報 責任編輯:蘇琳 我來說兩句 |
人工智能是數字經濟高質量發(fā)展的引擎,也是新一輪科技革命和產業(yè)變革的重要驅動力量。習近平總書記指出,人工智能是引領這一輪科技革命和產業(yè)變革的戰(zhàn)略性技術,具有溢出帶動性很強的“頭雁”效應。加快發(fā)展新一代人工智能是我們贏得全球科技競爭主動權的重要戰(zhàn)略抓手?!吨腥A人民共和國國民經濟和社會發(fā)展第十四個五年規(guī)劃和2035年遠景目標綱要》也做出了相關部署。 人工智能計算中心作為人工智能算力基礎設施受到全球廣泛重視。中國、美國、歐洲、日本等國家和地區(qū)都在積極推動人工智能計算中心建設。當前,人工智能計算中心的發(fā)展面臨新的形勢。一方面,人工智能的發(fā)展對算力的需求持續(xù)攀升,以鵬程·盤古為代表的超大規(guī)模預訓練模型開始賦能各行各業(yè);另一方面,在國家“雙碳”戰(zhàn)略下,需要計算中心加強統籌建設和提升利用率,進一步減排降耗。君子豹變,其文蔚也,新形勢下,人工智能計算中心正在悄然“豹變”,走向網絡化和集約化,將實現算力、大模型、數據集、行業(yè)應用等人工智能要素流動共享,成為應對新需求的重要途徑。 人工智能計算中心不再作為獨立的系統,而是逐步走向相互連接的算力網絡,將深化人工智能計算中心的高質量建設,是人工智能計算中心下一步發(fā)展的新形態(tài)和新范式。新型網絡技術將各地分布的人工智能計算中心節(jié)點連接起來,構成感知、分配、調度人工智能算力的網絡,可以更好地匯聚和共享算力、數據、算法資源,更好地滿足我國經濟社會高質量發(fā)展的新需求。 推進人工智能計算中心高質量網絡化發(fā)展 人工智能計算中心及其網絡建設具有技術實現復雜、建設周期長、資源投入巨大、產業(yè)輻射面廣的特點,為了適應我國經濟高質量發(fā)展的需要,進一步推進人工智能的集約化、普及化、低碳化發(fā)展,我國需要進一步強化戰(zhàn)略統籌和政策保障,進行系統的組織機制和體制創(chuàng)新,加強關鍵核心技術攻關和標準化建設,以加快推動人工智能計算中心向高質量網絡化發(fā)展。 統籌推進計算中心高質量建設 在確保已建成的人工智能計算中心高效運營的同時,順應人工智能發(fā)展趨勢和產業(yè)落地的需求,我們必須堅持以應用為導向,堅持自主創(chuàng)新技術路線,加強人工智能計算中心建設。 繼續(xù)推進計算中心高效運營和可持續(xù)發(fā)展。已建成的人工智能計算中心,要強化洞察人工智能產業(yè)發(fā)展現狀、調研算力需求的能力,繼續(xù)實施算力普惠政策,為行業(yè)用戶及應用開發(fā)企業(yè)、科研機構、高校提供普惠算力服務等。聯合產業(yè)組織編制面向人工智能應用場景的項目機會清單,面向人工智能企業(yè)、高校院所、科研機構進行公開發(fā)布,鼓勵開展人工智能先導性應用開發(fā)和場景試驗,牽引科技創(chuàng)新成果進行商用轉化,打造一批有影響力、有實際效果的應用示范項目,形成圍繞大模型的產業(yè)集群,進一步帶動產業(yè)智能化升級。 堅持自主創(chuàng)新技術路線與推動開放開源并重。在當前日益復雜的國際競爭環(huán)境下,在推動人工智能計算中心建設的過程中,要繼續(xù)堅持自主技術路線,進一步強化政策支持,廣泛吸納產學研用各方參與,共同提升相關產業(yè)鏈供應鏈現代化水平。同時,堅持自主創(chuàng)新技術路線并不意味著故步自封,閉門造車。在注重掌握核心競爭力的基礎上,仍需以積極開放的態(tài)度擁抱開源開放,在全球范圍內推動形成共建共享的人工智能算力與創(chuàng)新生態(tài)。 有序推進人工智能算力網絡建設 當前,順應新形勢的要求,推進人工智能算力網絡建設,我們亟須做好以下三個方面的工作。 鼓勵京津冀、長三角、粵港澳大灣區(qū)、長江經濟帶等人工智能發(fā)展基礎較好的重點區(qū)域先行發(fā)展人工智能算力網絡,有序推動各地人工智能計算中心加入算力網絡,探索推動算力跨網絡結算機制,降低算力網絡的使用費用。 重點區(qū)域先行先試,有序推進。在京津冀、長三角、長江經濟帶、粵港澳大灣區(qū)、成渝地區(qū)雙城經濟圈等人工智能創(chuàng)新資源聚集、產業(yè)聯系緊密的重點區(qū)域,可由節(jié)點城市平等互聯或一方牽頭,先行組建算力網絡,實現資源互換和共享。在各節(jié)點之間自發(fā)互聯和資源共享的基礎上,隨著更多網絡互聯和節(jié)點的加入,積極做好相關制度安排,探索形成統一規(guī)劃和統一管理全國范圍算力網絡的體制和機制。 激勵人工智能計算中心加入算力網絡,降低算力網絡使用費用,推動算力跨網絡結算;通過政策保障和資金支持,激勵不同運營主體的人工智能計算中心加入算力網絡,突破資源流動的實際障礙和地域壁壘;探索建立跨算力網絡結算機制,破解AI要素評級、定價、計費、傳輸、記賬、監(jiān)控、交易等機制建設難題,推動人工智能計算中心之間的算力、數據和生態(tài)服務實現可信交易,將多方、異構的資源整合在一起,實現供需的靈活對接、資源的統一管控,在滿足用戶業(yè)務需求的情況下,實現資源利用的整體最優(yōu)化。 加強人工智能算力網絡核心技術攻關 目前,我國人工智能算力網絡技術還處于早期發(fā)展階段,需要強化高效網絡傳輸、算力調度聯通等關鍵技術的研發(fā)部署和資金保障,引導相關企業(yè)和研究機構加大投入、聯合攻關。同時,在當前功耗技術和管理水平的基礎上,進一步加強綠色能源技術的研發(fā)和應用,提升電能利用水平,保證低碳可持續(xù)發(fā)展。 破解算力網絡關鍵核心技術難題,加大攻關資金保障。開發(fā)高效網絡傳送技術,重點解決高帶寬低成本傳送、低延遲低抖動聯接和信息安全等問題,以滿足海量數據傳輸和分布式計算需求。開發(fā)適用于算力網絡的調度器技術,實現作業(yè)調度層面聯通,構建多級的算力調度系統層以實現全網算力與網絡的調度、匹配,形成一個“算力操作系統”,將整個網絡上的算力節(jié)點納入統一的體系。要圍繞以上關鍵技術問題,通過出臺相關科技攻關專項等方式,聯合計算技術、網絡技術等多技術廠商和科研機構共同攻關。 以低碳綠色技術為牽引優(yōu)化人工智能算力的利用率和能耗。圍繞人工智能計算中心及算力網絡可持續(xù)發(fā)展,強化綠色能源技術的研發(fā)應用。在技術研發(fā)上,出臺政策牽引節(jié)能技術成為算力技術研發(fā)的重點方向,并積極使用綠色新能源和能效技術。在規(guī)劃和建設上,人工智能計算中心要盡量靠近能源豐富且便于天然散熱的地區(qū),更多使用可再生能源,推廣使用一體化機柜和液冷等先進散熱方案。 推動人工智能算力網絡標準化建設 在推動人工智能算力網絡建設過程中,算力網絡的一體化標準至關重要,需在各人工智能計算中心自身標準研究與應用實踐的基礎上,積極推動建立統一的算力網絡標準,形成包括算力網絡架構、節(jié)點互聯標準、應用接口標準、人工智能數據集接口標準等在內的標準體系,兼容多樣化算力和開發(fā)框架等軟硬件平臺,以促進AI要素在算力網絡上的開放共享。其中包含以下三個方面的工作。 支持多樣化算力,形成可迭代可替換的硬件標準體系。國內多家廠商紛紛在AI算力投入研發(fā),逐步形成了自主創(chuàng)新的技術力量。不同廠商建設的人工智能計算中心所提供的算力資源包含多種不同類型指令集、不同體系架構異構硬件,比如CPU、NPU、GPU等,不同指令集、不同體系架構有不同的優(yōu)缺點,適配不同的場景。人工智能計算中心網絡在支持多樣化算力的過程中,需要適配不同廠商的基礎設施硬件架構,同時支持對不同廠商的硬件進行迭代和替換,提高算力基礎設施層的通用性、易用性。 堅持開放性和兼容性,推動構建算子、框架、平臺多層次互通的軟件標準體系。人工智能計算在發(fā)展中形成了各有特色和優(yōu)勢的算子庫、框架與使能平臺,并擁有各自的使用群體。算力網絡需要支持多算子庫、多人工智能開發(fā)框架和多使能平臺等基礎軟件,開發(fā)者可根據場景和需求來使用不同的框架與使能平臺。應加快建設跨廠家的算子庫、框架和使能平臺的多層次標準,對人工智能開發(fā)軟件系統分層解耦,層次之間接口統一且互聯互通,最終在算力網絡上形成開放的編程環(huán)境與編程接口標準。 以滿足場景應用聯合創(chuàng)新需求為重點,推動構建互聯、應用、人工智能數據集等接口標準。為解決算力感知與調度、區(qū)域協同聯合應用創(chuàng)新以及數據匯聚共享等技術問題,針對計算和服務感知、互聯和資源控制調度、應用場景聯合創(chuàng)新,重點推進算力網絡架構及接口、應用及算力感知接口、算力量化與建模、人工智能數據集接口、資源可信與協同等標準化建設。 * * * 人工智能算力網絡作為計算中心的新形態(tài)和新范式,讓科研創(chuàng)新更高效,讓人工智能與產業(yè)的融合更深入,共建資源、共享資源、共同發(fā)展,共同促進AI產業(yè)發(fā)展。人工智能算力網絡作為新型基礎設施,讓各區(qū)域共享資源,促進AI技術生態(tài)和商業(yè)生態(tài)發(fā)展,加速科學新發(fā)現、推動應用新場景、發(fā)現產業(yè)新方向、孵化發(fā)展新理念,為數字經濟發(fā)展提供原動力,打造中國人工智能的數字底座,在中國打造共同富裕的新格局中,發(fā)揮人工智能的引擎作用。 就是現在!進軍人工智能算力網絡 算力跨計算中心調度、大模型研究與產業(yè)跨區(qū)域創(chuàng)新協同、人工智能生產要素流動共享等新需求催生了人工智能算力網絡。人工智能算力網絡將各地分布的人工智能計算中心節(jié)點連接起來,構成多個計算中心間感知、分配、調度人工智能算力的網絡,在此基礎上匯聚和共享算力、數據、大模型等算法資源,是人工智能計算中心進一步發(fā)展的重要方向,將有助于推動構建區(qū)域范圍乃至全國范圍的人工智能產業(yè)生態(tài)網絡。 隨著5G、人工智能、云計算、大數據等新一代信息技術在各行各業(yè)廣泛應用,行業(yè)應用的多樣性帶來數據和算力的多樣性。未來,人工智能算力網絡將進一步連接高性能計算中心和一體化大數據中心,演進為多樣性算力網絡,滿足數字化技術交叉應用的廣泛需求。 人工智能算力網絡是以新型網絡技術連接各地人工智能計算中心,匯聚算力、算法、生態(tài)等創(chuàng)新資源,釋放人工智能產業(yè)賦能能力的新范式。通過算力網絡建設,打造中國信息基礎設施數字基座,實現“共建算力、共享資源、共同發(fā)展”的愿景。 人工智能算力網絡的核心思想是通過新型網絡技術將各地分布的人工智能計算中心節(jié)點連接起來,動態(tài)實時感知算力和網絡資源狀態(tài),進而統籌分配和調度計算任務,構成感知、決策、分配、調度算力的網絡,在此基礎上匯聚和共享算力、應用、數據、算法資源,是一種多資源、多樣性異構算力深度融合,釋放人工智能賦能能力的新范式。 人工智能算力網絡使算力資源從單計算中心統一分配轉變?yōu)樗杏嬎阒行拈g任務和資源統一調度。過去,人工智能算力中心在各地由企業(yè)和科研機構等分散建設、分散使用,正如私家車一樣由每個人自行購買、自行維護和使用,從全局視角來看,車輛使用率低,使用成本高。統籌建設人工智能等計算中心,可以實現資源統一分配,計算任務排隊管理,就像出租車一樣,車輛由出租車公司集中購買,車輛統一分配,用戶排隊打車,這樣出租車車輛使用率較高,成本降低,但用戶需排隊使用車輛,用車高峰時需要等候,且無法將空閑的社會車輛利用起來。 人工智能算力網絡將全部計算中心的算力需求統一管理,并將數據、算法、應用資源等開放共享,進行統一分配,實現了整網最大效率,并拓展了應用和創(chuàng)新的空間。正如當前的互聯網用車平臺,將加入平臺的車輛資源進行統一的按需分配,用戶向用車平臺申請用車,可以利用全網的車輛資源,用車更快,時間和費用的綜合成本進一步降低,全局資源利用率最優(yōu),實現可調度、可協同、可匯聚、可共享,達到了網絡價值的最大化。 從計算中心到算力網絡 符合國家“雙碳”目標新要求 在國家碳達峰、碳中和目標下,2021年10月21日,國家發(fā)展改革委等部門發(fā)布了關于嚴格能效約束推動重點領域節(jié)能降碳的若干意見,將“加強數據中心綠色高質量發(fā)展”作為重點任務,鼓勵重點行業(yè)利用綠色數據中心等新型基礎設施實現節(jié)能降耗。新建大型、超大型數據中心電能利用效率(PUE)不超過1.3。到2025年,數據中心電能利用效率普遍不超過1.5。這些均對人工智能計算中心提出了進一步提升電能利用率,在不同計算中心間算力協同調度、削峰填谷、精細化能耗控制的要求。 人工智能計算中心能耗總量較大,且還在不斷增長。2019年,馬薩諸塞大學阿默斯特分校的研究人員發(fā)現,訓練一個AI模型的過程中可排放超過626000磅二氧化碳,相當于普通汽車壽命周期排放量的5倍(其中包括汽車本身的制造過程)。統計表明,2018年中國所有數據中心的總用電量達1600億千瓦時,需消耗5300萬噸標準煤,占中國社會總用電量的2.5%。 工業(yè)和信息化部2021年7月印發(fā)的《新型數據中心發(fā)展三年行動計劃(2021- 2023年)》提出,到2023年底,全國數據中心機架規(guī)模年均增速將保持在20%左右。按照目前的增長速度推算,2023年中國所有數據中心用電量將達2600億千瓦時,相當于2.6個三峽大壩的年發(fā)電量。 人工智能計算中心提供人工智能計算范式所需的專用算力,配合少量的通用算力以進行數據預處理和其他任務,從而能夠以較低的能耗提供高效的人工智能計算能力。NVIDIA曾測算,在完成相同的人工智能計算任務條件下,人工智能計算中心的計算效率是傳統計算中心的10倍,而能耗僅為十分之一。近年來,計算中心不斷降低PUE,能耗效率顯著提升。原因主要有兩點:一是得益于統籌規(guī)劃,集中建設。在全球各地區(qū)政策的引導下,數據中心從較小的傳統數據中心向超大規(guī)模數據中心轉變。二是得益于制冷和供配電等基礎設施技術的不斷改進。這兩個措施有效降低了計算中心的PUE。2013年以前,全國對外服務型數據中心平均PUE在2.5左右,而到2019年底,全國對外服務型數據中心平均PUE近1.6,實現了質的飛躍。 雖然計算中心有效降低了PUE,但計算業(yè)務天然存在波動,仍存在能耗閑置現象。計算中心的業(yè)務波動會造成算力利用的波峰和波谷,在波谷時部分計算集群沒有任務運行,會發(fā)生能耗的閑置。如超大規(guī)模預訓練模型在人工智能計算中心訓練時,將占據計算中心大部分算力,持續(xù)數周或數月形成時間周期性的算力波動,在算力波峰時,算力滿負荷運行,其他計算任務排隊,在算力波谷時則造成能耗閑置。 因此,人工智能計算中心需要采用算力調度進一步降低業(yè)務波峰波谷造成的能耗閑置。多人工智能計算中心協同調度,在A中心算力波峰時,可以將排隊任務轉移到算力波谷的B中心計算,削峰填谷,多計算中心都可以保持算力高利用率,將計算中心的能耗充分利用起來,從全局和長遠角度看,是進一步提升電能利用率,降低碳排放的有效路徑。 國家“雙碳”目標對計算中心能耗控制提出了更高的要求,多計算中心間聯網感知計算應用所需算力資源,通過任務調度,在能效比的約束下作出算力調配的最優(yōu)決策,從全局視角看,可以獲得計算效率與能耗效率的最優(yōu)。 因此,算力網絡將成為人工智能計算中心下一步發(fā)展的新形態(tài)和新范式。人工智能超大規(guī)模預訓練模型的不斷涌現,基于大模型開發(fā)行業(yè)應用賦能區(qū)域經濟社會發(fā)展的需求激增,人工智能數據集等AI要素進一步流動和共享,以及社會對計算中心不斷提升能耗控制水平的要求,促使人工智能計算中心之間開始連接。人工智能計算中心不再是獨立的系統,而是形成相互連接的算力網絡。地理分布的多個算力中心將連接在一起,為基于基礎模型開發(fā)新型分布式融合應用提供支撐。算力網絡可以感知應用所需算力與存儲資源,通過任務調度滿足業(yè)務需求,多個組織用戶在多個計算中心共享算力和數據,滿足復雜應用對計算和數據處理的需求。 |
相關閱讀:
![]() |
![]() |
打印 | 收藏 | 發(fā)給好友 【字號 大 中 小】 |
信息網絡傳播視聽節(jié)目許可(互聯網視聽節(jié)目服務/移動互聯網視聽節(jié)目服務)證號:1310572 廣播電視節(jié)目制作經營許可證(閩)字第085號
網絡出版服務許可證 (署)網出證(閩)字第018號 增值電信業(yè)務經營許可證 閩B2-20100029 互聯網藥品信息服務(閩)-經營性-2015-0001
福建日報報業(yè)集團擁有東南網采編人員所創(chuàng)作作品之版權,未經報業(yè)集團書面授權,不得轉載、摘編或以其他方式使用和傳播
職業(yè)道德監(jiān)督、違法和不良信息舉報電話:0591-87095403(工作日9:00-12:00、15:00-18:00) 舉報郵箱:jubao@fjsen.com 福建省新聞道德委舉報電話:0591-87275327