:::

產業技術評析

SRAM記憶體微縮瓶頸下,新興替代技術發展分析
發表日期:2023-06-28
作者:楊智傑、吳玲生(資策會)
摘要:
台積電在2022年12月公布3奈米(N3)製程細節,新的製程節點通常能大幅提升性能、降低功耗、增加電晶體密度,但就台積電在IEDM 2022會議所公開的資料,發現相較5奈米(N5)製程,採用N3製程的SRAM面積僅縮小了約5%,引發市場關注。

全文:

一、前言

台積電在2022年12月公布3奈米(N3)製程細節,新的製程節點通常能大幅提升性能、降低功耗、增加電晶體密度,但就台積電在IEDM 2022會議所公開的資料,發現相較5奈米(N5)製程,採用N3製程的SRAM面積僅縮小了約5%,引發市場關注。SRAM是用於CPU、GPU快取記憶體(Cache),尤其高效運算(HPC)及人工智慧、機器學習(Machine Learning)的大量運算皆會對快取記憶體有極大要求,所以當先進製程在SRAM記憶體密度上遭遇微縮瓶頸,將對上述應用發展造成一定衝擊。

二、事件背景

台積電於2022年12月IEEE的國際電子元件會議(International Electron Devices Meeting, IEDM)上,公布最新N3製程技術細節,相較於N5製程SRAM單位面積的0.021µm²,N3與N3E對SRAM面積分別為0.0199µm²與0.021µm²,密度提升率僅分別為5%與0%(密度未提升),SRAM微縮停滯的狀況明顯。

而SRAM的微縮瓶頸不只在台積電發生,如Intel 4製程的SRAM密度,相較於Intel 7製程也僅有約23%的微縮。顯見SRAM微縮速度不及邏輯元件的瓶頸現象,且不限於單一業者,而是尖端晶片產業共同面臨的問題。

然而高效運算、AI推論以及機器學習等工作,因涉及大量數據的暫存、演算與搬動,而高度仰賴大量的SRAM記憶體儲存空間,以及運算單元(Processing Unit)與記憶單元間的溝通。例如用於自動駕駛的AI推論晶片,需在極低延遲的時間內,大量處理高解析度、高幀數(Frame per second, FPS)的細節影像資料,必須有大量SRAM暫存記憶體與運算單元同步運作,才得以完成任務。

在先進製程可能面臨SRAM無法繼續大幅優化之情形下,相關半導體替代技術、設計架構、解決方案等開始浮現。

三、新興記憶體技術與運算架構崛起

以下將提出幾個近年半導體業界針對記憶體技術與運算架構革新解決方案,包括「小晶片設計」、「記憶體內運算」、以及「新興儲存媒介」三項技術進行解析。

(一)小晶片設計

小晶片設計是利用先進封裝技術,將不同製程節點的「小晶片」封裝(Package)至單一晶片的作法,從而增加晶片運算單元與記憶體堆疊密度,緩解摩爾定律(Moore′s Law)微縮難以維持的問題,並以不同製程的異質(Heterogeneous)小晶片組成完整晶片,降低晶片製造成本,例如將主要運算單元以先進製程製造,而記憶體、I/O單元等則以成熟製程製造。

AMD最早將此技術用於其桌機及伺服器CPU。在2021 Computex,AMD宣布採用Zen 3D V-Cache Chiplet技術於Ryzen CPU。AMD 3D V-Cache利用TSMC Chip-on-Wafer(CoW)技術,將64MB SRAM晶粒(die)堆疊在Zen 3 CCD(Core Chiplet Die)上,一個8核CCD本就配32MB L3快取,合在一起達96MB。兩種晶圓則是透過矽穿孔(Through Silicon Via, TSV)打線封裝在一起。根據AMD公開資訊稱L3快取頻寬超過2TB/s,幾乎可達到L1記憶體頻寬。

高算力對記憶體頻寬的需求越來越高,讓高頻寬記憶體的整合發展成為半導體廠商關鍵競爭力,2023年預期將有更多3D整合及堆疊記憶體量產。

(二)記憶體內運算

現代電腦主流的「馮紐曼架構」(Von Neumann model)中,控制單元(Control Unit)、運算單元(Arithmetic Logic Unit)以及記憶體(Memory)通常為獨立單元,並使用資料排線進行數據傳輸,傳統的單晶片(SoC)以及異質晶片架構而成的小晶片封裝,皆屬於上述的「馮紐曼架構」範疇。

為使資料處理速度不受記憶體傳輸頻寬所侷限,影響運算速度,近年來半導體界開始投入記憶體內運算(Computing-in-memory, CIM)。這種計算架構基本上已脫離馮紐曼架構,記憶體同時執行處理器與記憶體的功能,處理器與記憶體不再是個別的個體,可大幅減少資料往返之功耗。

一個SRAM的CIM架構通常具有3層。電路層的儲存單元(bitcell)負責讀寫,功能層(function)執行邏輯運算,第3層為應用層(application),可在SRAM記憶體中處理如平行運算、影像辨識等AI工作或高即時性的工作,減少在運算單元與記憶體間資料切換、搬移的頻率與體量,以解決運算及儲存單元間的搬運延遲、傳輸功耗等問題。

近年包括Intel、IBM、Fujitsu等大廠皆有推出CIM架構產品,而微軟、SAP、Oracle等亦相續提出CIM運算軟體與解決方案。上述「以記憶體為核心」的儲存運算架構,亦為AI浪潮發展下晶片產業的可能契機之一。

(三)新興儲存媒介

新興的MRAM「磁阻式隨機存取記憶體」(Magnetoresistive Random Access Memory, MRAM),目前三星、台積電等皆有投入研發。MRAM除可微縮到10奈米以下,也兼具耗能低、讀寫速度快、斷電資料不消失等特點。

有別於SRAM以通電與否來儲存位元值(0及1),MRAM是利用改變磁阻方向的不同,來儲存0與1的位元值,並具備非揮發性(切斷電源仍可保持資料存儲狀態)、無限的讀寫次數、高寫入速度、低功耗、零待機功率等特性。而SRAM由於為揮發型(Volatile)儲存媒介,需要週邊充電電容進行持續性供電,而供電模組是製程上較難以微縮的元件。相較於此,非揮發型(Non-volatile)的MRAM因無須週邊持續性供電模組,可省去供電電路占用的空間,且其本身所需電晶體數量較少,因而在面積節約上可較SRAM更為突顯優勢。

基於小型、非揮發特性,MRAM目前較多於低運算密度,具高度節能需求的IoT物聯網、嵌入式設備、以及穿戴式設備中使用。然而近年多家業者投入發展MRAM技術,並可逐漸應用於L3、L4快取(Cache)及AI晶片,在特定運算工作與SRAM合作共存。如三星在2022年發布基於MRAM的AI運算晶片,可在圖形分類、人臉偵測等工作上達到高準確率,GreenWave亦已運用格羅方德22奈米成熟製程的MRAM技術開發AI晶片。然而MRAM技術發展,在未來是否可能取代SRAM關鍵的L1、L2快取,仍值得密切關注。

四、新興記憶體技術發展對臺廠契機

小晶片設計高度仰賴新型態的封裝、配線以及載板設計,模組及工序包括晶片分層、走線、橋接晶粒(Bridge Die)、封裝測試等,對於國內封裝產業、印刷電路板(PCB)產業皆帶來相關機會,目前除了Chiplet標準UCLe發起者的台積電、封測廠日月光外,國內載板業者,如:南亞電路板、欣興電子、景碩科技等、封裝設備廠如弘塑科技等業者,亦已投入相關業務與產品布局。而由於多家海外大廠(包括Intel、AMD、Apple)皆已推出高效能的小晶片架構產品,小晶片無疑將成為晶片產業鏈重要的發展方向之一。

而記憶體內運算目前在國內學研界,主要由工研院作為領先者,開發出28奈米製程下,全世界最高效能的三元卷積神經網路(Ternary CNN)記憶體內運算AI晶片,以及用於行動裝置的記憶體內運算AI晶片,降低運算單元與儲存單元的傳輸負載。臺灣記憶體廠商,包含旺宏、華邦與力積電等,皆投入記憶體內運算研發,如旺宏電子的FortiXTM、力積電的AIM(AI in Memory),已用於低耗能5G及AI邊緣運算情境中,以及資料中心,伺服器晶片等產品線。預計記憶體內運算之發展,可陸續帶動記憶體相關產業鏈之發展契機。

最後,MRAM具有多種技術分支,目前較主流的分支有STT-MRAM以及SOT-MRAM。STT-MRAM技術由美國Everspin公司持有,目前發展較為成熟,台積電、三星等業者亦已提供代工服務,2022年9月,聯電亦宣布與Avalanche Technology合作推出22奈米製程的STT-MRAM解決方案。而技術難度較高、但讀寫速度表現更佳的SOT-MRAM研發,目前則暫由Intel領先,臺灣則有國研院半導體研究中心、工研院與台積電之合作開發計畫,此外,如力旺電子等國內矽智財(IP)業者,亦已開始針對成熟製程的嵌入式、車用MRAM晶片進行布局。

五、結論與觀點

在台積電、Intel等全球各大晶圓製造廠面臨記憶體微縮瓶頸下,新興替代技術的出現逐步推動晶片架構創新。其中,小晶片的技術變革,由於涉及IC製造、2D、2.5D、3D架構下的載板設計、走線、整合測試與設備等先進封裝環節,而除AMD、Intel等CPU大廠外,Apple於2022年的M1 Ultra亦已導入小晶片設計,並預期帶動後續產業示範效應,因此從需求面與生產面來看,國內晶片相關業者投入小晶片發展,具備相當優勢與市場契機。

而記憶體內運算技術CIM的發展,則將來自全球快速增長的AI、機器學習等算力需求,少數國內記憶體業者已發展商用化的CIM技術,在巨頭寡占的記憶體產業,試圖打破運存架構限制,並逐漸往高階應用探索。最後,MRAM儲存媒介的發展,雖是由底層物理材質與架構進行革新,並已在嵌入式、小型的感測裝置開始普及,但在高階運算領域上,目前各國尚在進行產學試驗,技術標準亦尚未統一,因此距離實際規模化仍有長路要走。

另外,雖然新興記憶體技術發展迅速,但對於是否能取代主流應用的SRAM,值得持續觀察。主要由於用於指令(Instruction)及運算結果暫存的SRAM的L1、L2快取,要求在數週期的CPU週期(Cycle)內完成,而目前新興記憶體架構技術(如MRAM)的存取速度,尚無法和L1、L2 快取比擬。因此相關替代技術,目前仍多用於特定任務之處理(如處理批量任務的AI推論晶片、影像辨識晶片、物聯網數據處理晶片),距離取代較泛用的SRAM,仍有相當距離,然而相關技術在特定應用IC(Application Specific Integrated Circuit, ASIC),如AI、機器學習、數據處理專用晶片上,與現有SRAM共存,應更可加速擴散其普及度。

(本文作者為資策會MIC執行產業技術基磐研究與知識服務計畫產業分析師)


* 點閱數1704
更新日期:2020-04-08

回上一頁 回首頁