智算中心建設面臨閑置與虧損問題,政府調整投資節奏與能耗指標政策
智算中心在全國各地陸續建立,卻不幸陷入了諸多困境。不論是國內的還是依賴英偉達的設施,閑置和虧損都成為了明顯的難題。政府已經注意到了這個問題,那么,我們是否應該重新考慮智算中心的布局和發展步伐?
智算中心的閑置現狀
多地智算中心建設初期便顯現出閑置問題。一些城市不惜投入巨資建設,動用了眾多資源。然而,由于種種原因,這些智算中心設備多數時間閑置,未能充分發揮效用。觀察運營主體,雖然投入了大量資金,卻因業務量不足而出現虧損,部分運營主體甚至陷入收支不平衡的困境。
各地情況不一,有的地方因能耗指標等原因與供應商協商耗時過長,建設進度因而緩慢;另一些地方雖然建設迅速,卻因需求不足而虧損嚴重,這些問題亟需解決,高層也開始重視這一問題。
算力需求的不平衡
大模型的算力需求情形相對復雜。在超大規模大模型訓練方面,算力供應明顯不足。然而,在其他大模型的算力需求上,情況并非緊急。眾多企業實際上能夠采用國產AI芯片,無需依賴最新的英偉達GPU。綜合考慮成本、價格以及易用性等因素,當前形勢下,企業有其他選擇。
不少企業在多種場合下會選用消費級顯卡,這樣做既減少了開支,又能夠滿足使用需求。消費者可以觀察到,并非所有情況下都必須追求最頂級的設備,這種選擇是企業根據自身需要做出的考量。
網絡與調度的難題
網絡對大模型有了全新的要求。以往未曾出現如此需求模式,因此目前尚無完全成熟的網絡解決方案。各種網絡方案正邊探索邊實施。實際上,網絡技術對智算中心的規模構建起著決定性的影響。
然而,當算力集群規模較小時,網絡處理相對簡單,但規模與效率難以兼顧。為此,我們亟需一種高靈活度的計算任務調度策略,以提升資源利用率,并使算力價格更為公道。然而,要實現這一目標,必須攻克眾多技術難關。
海外生態體系依賴
我國智算中心普遍依賴海外生態體系。目前看來,還需大約三到五年的時間來過渡。若此刻盲目加快智算中心的建設步伐,必將造成嚴重資源浪費。類似的情況,許多企業囤積英偉達卡,卻缺少構建智算中心所需的網絡、調度及運維能力,結果只能是算力被浪費。
我國在智算中心技術領域與國外相比還有較大差距,目前我們正處于依賴階段,要想實現完全自給自足尚有難度。然而,行動的起點應當從現在開始。
運營管理的欠缺
智算中心的運營管理現狀并不理想。其中,專業技術人才的短缺和高效管理團隊的缺失,都可能導致一系列問題。若缺乏相應的人才支持,智算中心的設備效能恐難得到充分發揮。
現實中有一個鮮明的例子,那就是設備閑置和資源浪費的現象時有發生。這就像擁有了精良的武器卻無人能駕馭,智算中心雖然配備了強大的設備和卓越的性能,卻因缺乏人才而無法充分發揮其潛力。
政策調整的新導向
從政策的角度來看,政府對智算中心的要求如今更為嚴格。以往,只要建成即可,但如今,從建設之初就必須考慮選擇合適的運營方,或者選擇建設與運營相結合的模式。這一做法旨在提升算力的利用率。
當前市場狀況下,眾多大型模型制造商削減了預訓練規模,那些以往熱衷于囤積算力的企業,如今亦無需大量租用外部算力。在這種背景下,智算中心唯有拓展推理應用場景,落地更多實際應用,并使終端用戶更加分散,方能更有利于市場的整體健康發展。那么,大家覺得智算中心應如何突破這一困境?期待大家的分享與點贊,共同探討。
作者:小藍
鏈接:http://www.tymcc.com.cn/content/4897.html
本站部分內容和圖片來源網絡,不代表本站觀點,如有侵權,可聯系我方刪除。