谷歌 I/O 大會公布第二代 TPU,內部使用,細節披露
谷歌的TPU2硬件宛如一座深藏不露的寶藏,知曉其存在的研究人員寥寥無幾,他們能通過TRC直接觸及。這個“高度選擇性”的項目,充滿了諸多謎團。單是這一點,就足以令人稱奇。如此獨特的資源,為何對其訪問設有如此嚴格的限制?
TPU2與TRC的關系
TPU2的研究云(TRC)僅供少數人訪問,這通道顯然是為研究人員量身打造的。這表明谷歌對TPU2項目有著明確的目標定位。它并非面向大眾,而是專門為那些專注于特定領域的研究者開放。這與大眾可以隨意使用的云計算資源有著根本的不同。此外,TRC如同一個門檻,限制了TPU2用戶的范圍。在硬件訪問機制中,這顯得格外特別,使得TPU2宛如深藏不露的珍貴寶石。
這種做法只允許極少數人通過TRC訪問TPU2,這難道不是限制了其潛在價值的深入挖掘嗎?
TPU2連接的隱藏性
在主板處理能力或PCI-E吞吐量未超負荷之前,谷歌從未公開透露連接到服務器主板上的TPU數量。這種隱秘的做法讓人難以捉摸。谷歌此舉或許出于多方面考量。一方面是為了技術層面的保密,另一方面或許是為了減少外部干擾。而且,即便是在將每個TPU2板連接到兩個處理器板的過程中,谷歌也不希望增加自身對拓撲結構的安裝、編程和調度復雜性的混淆。這種復雜的連接方式,在硬件領域堪稱獨樹一幟。
難道隱藏TPU2連接狀況就能保證其安全性和穩定性的提升嗎?
TPU2與至強芯片的配比
TPU2芯片與至強處理器之間的比例是2比1,這與GPU加速器在深度學習任務中的4比1或6比1的比例有著顯著差異。這表明TPU2與處理器之間存在著緊密的耦合關系。據推測,這個2比1的配比可能是谷歌經過大量實驗得出的最佳比例。不同的配比在數據處理速度和能效等方面會產生不同的影響。特別是在深度學習任務的數據運算和處理上,這種配比或許能展現出更高的效率。
這種配比與傳統的GPU加速器配比相較,是否預示著未來硬件配比的新潮流?
機柜內硬件關聯
TPU2機柜內部的聯系相當神秘,我們并不清楚一個機柜中的CPU與TPU2芯片是如何相互連接的。TPU2芯片在共享數據時,還需依賴超網格的連接。處理器池本應提供機柜的超網格拓撲圖,以便明確哪些TPU2芯片能夠用于執行任務。這種模糊不清的連接方式,是谷歌技術中的一個謎團,外界難以知曉其具體的邏輯和運作機制,或許這與核心技術的保密策略有關。
在難以弄清楚CPU和TPU2芯片在機柜內是如何相互關聯的情況下,我們能否推測出它們之間關聯的大致原理?
TPU2運算處理模式的優勢
TPU2芯片無需處理多任務、虛擬化或多租戶,柜上的運算任務由CPU承擔。這種運算處理方式頗具特色。它使得TPU2能專注于特定任務,將復雜的管理和多任務處理工作交給CPU。這樣做減輕了TPU2的工作負擔,同時充分發揮了CPU在管理方面的優勢。在運算處理過程中,這樣的安排有助于提升整體運算效率和資源分配的合理性。
CPU負責統一管理復雜事務,而TPU2則專注于運算,這種模式能否應用到其他硬件設備上?
TPU2的性能與比較
研究人員雖然能夠連接到一定數量的TPU2芯片集群,但要擴展到整個機柜卻面臨挑戰。每個機柜都有其特定的性能表現,比如FP16運算能力在每瓦100至115之間。然而,目前尚無足夠的信息來將TPU2機柜與英偉達Volta等商用產品進行對比。谷歌的TPU2從第一代到第二代,其與CPU的關系發生了變化,但在市場比較方面,卻缺乏足夠的信息來明確其定位。
在信息不足,無法與其他產品進行對比的情況下,TPU2的市場價值又該如何進行準確的評估?
對TPU2硬件的這些特性感興趣的話,不妨點贊、分享這篇文章。同時,也歡迎在評論區展開討論。
作者:小藍
鏈接:http://www.tymcc.com.cn/content/3746.html
本站部分內容和圖片來源網絡,不代表本站觀點,如有侵權,可聯系我方刪除。