之前的計算時代(大型機/小型機、PC/服務器和智能手機/平板電腦)都受益于摩爾定律的進步,即2D縮放同時伴隨著性能、功耗和面積/成本的提高(也被稱為“PPAC”)。
當人工智能應用蓬勃發展時,摩爾定律正在放緩;因此,該行業需要突破2D縮放,以新的方式驅動PPAC。具體來說,我們需要新的計算架構、新的材料、新的結構(尤其是節省面積的3D結構)以及先進的芯片堆疊和異構設計的封裝。
AI時代結構設計的變化影響了邏輯和存儲。機器學習算法大量使用了矩陣乘法運算,而這些運算在通用邏輯中十分繁瑣,這推動了加速器及存儲器的發展。AI計算包括兩個不同的內存任務:首先,存儲計算的中間結果;其次,存儲與訓練模型相關的權重。
性能和功耗在云計算和邊緣計算中都很重要,而存儲方面的創新可能會有所幫助。使用現有內存技術的一種方法是“近內存”,即大量的工作內存被壓縮后放置在接近邏輯的物理位置,并通過高速接口連接。在這些應用場景中,SRAM和DRAM作為“工作內存”的一個主要缺點是,它們是易失的,需要持續供電來保存數據(比如權重)。
為了降低云計算和邊緣計算的功耗,設計人員正在評估將高性能和非易失性結合在一起的新型存儲,以便只在讀寫操作期間需要耗電。三種主要的新存儲器候選是磁性隨機存取存儲器(MRAM)、相變存儲器(PCRAM)和電阻存儲器(ReRAM)。
這三種存儲器都采用了新的材料,可以被設計成高電阻率和低電阻率,而高電阻率和低電阻率又分別代表0和1。MRAM通過改變磁性方向來控制電阻率;PCRAM利用材料從無定形到結晶的排列變化;ReRAM在材料中創建了一個纖維。PCRAM和ReRAM都提供了電阻率中間階段的可能性,允許在每個單元中存儲多個比特。
讓我們來研究一下AI時代的計算應用場景,以及它們是如何推動路線圖中的創新的。
新型存儲器是怎樣創造AI算力的
物聯網的邊緣計算應用可以分為低性能/低功耗應用和高性能/高功耗應用。
低性能/低功耗應用的例子是安全攝像頭,它可以在用戶端應用AI算法實現面部和語音識別。設計目標是在邊緣處理盡可能多的數據,只向云端傳輸重要的信息。性能要求低是因為采樣率低,包括備用電源在內的電力消耗是至關重要的,特別是在電池供電的設備中。
業界目前在邊緣計算設備中使用SRAM內存。SRAM并不理想,因為它每個存儲單元需要多達6個晶體管,而且工作室漏電可能很高。SRAM在存儲權重時并不節能,在低頻設計中尤其如此。作為一種替代方案,MRAM承諾將使晶體管密度提高數倍,從而實現更高的存儲密度或更小的芯片尺寸。MRAM的另一個關鍵特性是它可以被設計成嵌入式系統芯片產品的后端互連層。MRAM可用于存儲SOC的操作系統和應用程序,從而消除了為此目的而使用嵌入式閃存芯片的需要,從而降低了系統芯片總數和成本。
高性能的“近邊緣”應用場景,如缺陷檢測和醫學篩選,需要更高的性能。一種被稱為自旋軌道轉矩MRAM (SOT-MRAM)的MRAM變體可能被證明比自旋轉矩轉移MRAM (STT-MRAM)更快、更低功耗。
云計算需要盡可能高的計算性能,而訓練需要大量的數據來接近機器學習加速器,因此機器學習加速器有大量的片內SRAM緩存,并輔之以大量的片外DRAM陣列,這些DRAM陣列需要恒定的功耗。用電量對云服務提供商很重要,因為在人工智能時代,數據呈指數級增長,而電網電力有限且昂貴。PCRAM是云計算架構的一個主要候選者,因為它比DRAM提供更低的功耗和成本,并且比固態硬盤和硬盤驅動器具有更高的性能。
除了這些“二進制”邊緣、近邊緣和云應用之外,還有對存儲器內計算的研究。機器學習的頻繁矩陣乘法運算可以在一個存儲器陣列中執行,設計人員正在探索偽交叉點架構,其中的權重存儲在每個內存節點上。PCRAM、ReRAM甚至是鐵電場效應晶體管(FeFETs)都是很好的選擇,因為它們都有實現每單元存儲多bit的潛力。目前,ReRAM似乎是這個應用場景最可行的內存,矩陣乘法可以利用歐姆定律和基爾霍夫定律在陣列內完成,而不需要將權重移進移出芯片。多層單元結構保證了新的內存密度級別,允許設計和使用更大的模型。要實現這些新的模擬存儲器,需要對新材料進行廣泛的開發和工程設計,而應用材料公司正在積極開拓一些領先的候選領域。
雖然摩爾定律的指數增長速度已經放緩,但人工智能時代的數據仍將呈指數級增長。這種趨勢已經推動了建筑、材料、3D結構和先進封裝技術的創新——用于芯片堆疊和異構集成。存儲越來越接近人工智能計算引擎,最終,存儲可能成為人工智能計算的引擎。隨著這些創新的展開,我們將看到性能、功耗和密度(面積/成本)方面的顯著改善——新興存儲優化以滿足邊緣計算、近邊緣和云計算的需求。實現硬件方面的復興,才能充分挖掘人工智能時代的潛力。
關鍵詞標簽:海量存儲 文件存儲 分布式存儲 國產存儲 私有云 企業級存儲 軟件定義存儲