楠木軒

英特爾工藝“再造”的殺手鐧

由 廉擁軍 發佈於 科技

對英特爾來説,工藝絕不是單純的數字進階,而是多路並進的神奇組合,8月13日,英特爾2020年架構日則再次刷新了“再造”記錄。

英特爾首席架構師Raja Koduri攜手多位英特爾院士和架構師,詳細介紹了英特爾在創新的製程與封裝、架構、內存與存儲、互連、軟件、安全六大技術支柱方面所取得的進展。

基於這六大技術支柱,英特爾重點介紹了有關製程的10nm SuperFin技術,有關封裝的“混合結合”技術,有關架構的Willow Cove和Tiger Lake CPU架構、混合架構、Xe  圖形架構和數據中心架構以及有關軟件的oneAPI Gold。

在製程方面,10nm SuperFin技術是該公司有史以來最為強大的單節點內性能增強,帶來的性能提升可與全節點轉換相媲美。10nm SuperFin技術實現了英特爾增強型FinFET晶體管與Super MIM(Metal-Insulator-Metal)電容器的結合。與行業標準相比,在同等的佔位面積內電容增加了5倍,從而減少了電壓下降,顯著提高了產品性能。

據介紹,該技術由一類新型的“高K”( Hi-K)電介質材料實現,該材料可以堆疊在厚度僅為幾埃厚的超薄層中,從而形成重複的“超晶格”結構。這是一項行業內領先的技術,領先於其他芯片製造商的現有能力。

在封裝方面,使用“混合結合(Hybrid bonding)”技術的測試芯片已在2020年第二季度流片。據瞭解,當今大多數封裝技術中使用的是傳統的“熱壓結合(thermocompression bonding)”技術,而混合結合是這一技術的替代品。這項新技術能夠加速實現10微米及以下的凸點間距,提供更高的互連密度、帶寬和更低的功率。

在架構方面,英特爾一次性介紹了多款架構。

據介紹,Willow Cove是英特爾的下一代CPU微架構。Willow Cove基於最新的處理器技術和10nm的SuperFin技術,在Sunny Cove架構的基礎上,提供超越代間CPU性能的提高,極大地提升了頻率以及功率效率。它還將重新設計的緩存架構引入到更大的非相容1.25MB MLC中,並通過英特爾控制流強制技術(Control Flow Enforcement Technology)增強了安全性。

Tiger Lake將在關鍵計算矢量方面提供智能性能和突破性進展。Tiger Lake是第一個SoC架構中採用全新 Xe-LP圖形微架構,可以對CPU、AI加速器進行優化,將使CPU性能得到超越一代的提升,並實現大規模的AI性能提升、圖形性能巨大飛躍,以及整個SoC 中一整套頂級 IP,如全新集成的Thunderbolt 4。

不僅如此,混合構架Alder Lake是英特爾的下一代採用混合架構的客户端產品,能夠提供更出色的效能功耗比。

在介紹Xe  圖形架構時,英特爾介紹了基於此架構下的多款產品,包括Xe-LP(低功耗)、Xe-HP、Xe-HPG、英特爾Server GPU(SG1)、DG1和英特爾顯卡指揮中心(IGCC)。

Xe-LP是經優化的微架構和軟件可為移動平台提供高效的性能。這將使新的終端用户功能具備即時遊戲調整(Instant Game Tuning)、捕捉與流媒體及圖像鋭化。在軟件優化方面,Xe-LP將通過新的DX11路徑和優化的編譯器對驅動進行改進。Xe-HP是業界首個多區塊(multi-tiled)、高度可擴展的高性能架構。在架構日活動中,英特爾展示了Xe-HP在單個區塊上以60 FPS的速率對10個完整的高質量4K視頻流進行轉碼。另一個演示還展示了Xe-HP在多個區塊上的計算可擴展性。據瞭解,英特爾現在正在與關鍵客户一起測試Xe-HP,並計劃通過Intel DevCloud使開發者可以使用Xe HP。而Xe-HPG是一種為遊戲優化的微架構,是Xe微架構變體。擁有良好的效能功耗比、可擴展性,並且增加了加速的光線跟蹤支持。 

英特爾Server GPU(SG1)是英特爾針對數據中心的首款基於Xe架構的獨立圖形顯卡,可以很小的尺寸將性能提升至數據中心級別,以實現低延遲、高密度的安卓雲遊戲和視頻流。DG1是英特爾首款基於Xe架構的獨立圖形顯卡,現在可在英特爾DevCloud上供早期訪問用户使用。英特爾顯卡指揮中心(IGCC)引入了新功能,包括即時遊戲調整和遊戲鋭化。

在介紹數據中心架構時,英特爾介紹了Ice Lake、Sapphire Rapids和下一代224G-PAM4 TX收發器。Ice Lake是首款基於10nm的英特爾至強可擴展處理器,將在跨工作負載的吞吐量和響應能力方面提供強勁性能。Sapphire Rapids是英特爾基於增強型SuperFin技術的下一代至強可擴展處理器,將是美國阿貢國家實驗室“極光”超級計算機系統(Aurora Exascale)中使用的CPU。而世界上第一台下一代224G-PAM4 TX收發器便是此次介紹的產品。

在軟件方面,英特爾於7月發佈了其第八版的oneAPI Beta,為分佈式數據分析帶來了新的功能和提升,包括渲染性能、性能分析以及視頻和線程文庫。此次各項技術創新揭示了英特爾“六大技術支柱”創新戰略的持續邁進。英特爾正充分利用其獨特的優勢,提供標量、矢量、矩陣和空間架構結合的解決方案,廣泛部署於CPU、GPU、加速器和FPGA中,並由開放的、符合行業標準的編程模型oneAPI實現統一,從而簡化應用程序開發。

產品預計推出時間:

產品技術簡介:

10nm SuperFin技術

SuperFin技術能夠提供增強的外延源極/漏極、改進的柵極工藝和額外的柵極間距,並通過以下方式實現更高的性能:

增強源極和漏極上晶體結構的外延長度,從而增加應變並減小電阻,以允許更多電流通過通道;

改進柵極工藝以實現更高的通道遷移率,從而使電荷載流子更快地移動;

提供額外的柵極間距選項可為需要最高性能的芯片功能提供更高的驅動電流;

使用新型薄壁阻隔將過孔電阻降低了30%,從而提升了互連性能表現。

封裝

“混合結合(Hybrid bonding)”技術:“熱壓結合(thermocompression bonding)”技術的替代品,加速實現10微米及以下的凸點間距,提供更高的互連密度、帶寬和更低的功率。

Willow Cove CPU架構

Willow Cove基於最新的處理器技術和10nm的SuperFin技術,在Sunny Cove架構的基礎上,提供超越代間CPU性能的提高,極大地提升了頻率以及功率效率。

它還將重新設計的緩存架構引入到更大的非相容1.25MB MLC中,並通過英特爾控制流強制技術(Control Flow Enforcement Technology)增強了安全性。

Tiger Lake CPU架構

Tiger Lake SoC架構提供:

全新Willow Cove CPU核心 – 基於10nm SuperFin技術進步,顯著提升頻率;

新Xe圖形架構 – 具有高達96個執行單元(EUs),每瓦性能效率顯著提高;

電源管理 – 一致性結構中的自主動態電壓頻率調整(DVFS),提高了全集成電壓穩壓器(FIVR)效率;

結構和內存 – 一致性結構帶寬增加2倍,約86GB/s內存帶寬,經驗證的LP4x-4267、DDR4-3200;LP5-5400架構功能;

高斯網絡加速器GNA 2.0專用IP,用於低功耗神經推理計算,減輕CPU處理。運行音頻噪音抑制工作負載情況下,採用GNA推理計算的CPU利用率比不採用GNA的CPU低20%;

IO – 集成TB4/USB4,CPU上集成PCIe Gen 4,用於低延遲、高帶寬設備對內存的訪問;

顯示 – 高達 64GB/s的同步傳輸帶寬用於支持多個高分辨率顯示器。到內存的專用結構路徑,以保持服務質量;

IPU6 – 多達6個傳感器,具有4K 30幀視頻、27MP像素圖像;最高4K90幀和42MP像素圖像架構功能

混合架構

Alder Lake將結合英特爾即將推出的兩種架構——Golden Cove和Gracemont,並將進行優化,以提供出色的效能功耗比。

Xe  圖形架構

Xe-LP是英特爾針對PC和移動計算平台的最高效架構,最高配置EU單元多達96組,並具有新架構設計,包括異步計算、視圖實例化 (view instancing)、採樣器反饋(sampler feedback)、帶有AV1的更新版媒體引擎以及更新版顯示引擎等。這將使新的終端用户功能具備即時遊戲調整(Instant Game Tuning)、捕捉與流媒體及圖像鋭化。在軟件優化方面,Xe-LP將通過新的DX11路徑和優化的編譯器對驅動進行改進。

Xe-HP是業界首個多區塊(multi-tiled)、高度可擴展的高性能架構,可提供數據中心級、機架級媒體性能,GPU可擴展性和AI優化。它涵蓋了從一個區塊(tile)到兩個和四個區塊的動態範圍的計算,其功能類似於多核GPU。

Xe-HPG是Xe微架構變體,這是一種為遊戲優化的微架構,在Xe-LP的構建模塊的基礎上添加了基於GDDR6的新內存子系統以提高性價比,且將具有加速的光線跟蹤支持。

英特爾Server GPU(SG1)是英特爾針對數據中心的首款基於Xe架構的獨立圖形顯卡。SG1通過實現4個DG1的聚合,可以很小的尺寸將性能提升至數據中心級別,以實現低延遲、高密度的安卓雲遊戲和視頻流。

DG1是英特爾首款基於Xe-LP微架構針對PC的獨立圖形顯卡。

英特爾顯卡指揮中心(IGCC)引入了新功能,包括即時遊戲調整和遊戲鋭化。即時遊戲調整是一個專用於遊戲的驅動,可以比以前更快地推送修復和優化給最終用户,而且不需要下載和安裝完整的驅動程序。它只需要用户在每個遊戲選擇加入一次即可;遊戲鋭化使用感知自適應鋭化,一種基於計算着色器的自適應鋭化算法提高遊戲中的圖像清晰度。此功能對於使用分辨率縮放以平衡性能和圖像質量的遊戲尤其有用,並且是IGCC中的一項可選功能。

數據中心架構

Ice Lake是首款基於10nm的英特爾至強可擴展處理器。Ice Lake產品將在跨工作負載的吞吐量和響應能力方面提供強勁性能。它將帶來一系列技術,包括全內存加密、PCIe Gen 4、8個內存通道等,以及可加快密碼運算速度的增強指令集。

Sapphire Rapids是英特爾基於增強型SuperFin技術的下一代至強可擴展處理器,將提供領先的行業標準技術,包括DDR5、PCIe Gen 5、Compute Express Link 1.1等。

軟件

oneAPI Gold為開發人員提供在標量、矢量、距陣和空間體系結構上保證產品級別的質量和性能的解決方案。DG1獨立GPU當前在英特爾DevCloud上可供部分開發人員使用,其中包含DG1文庫和工具包,來使他們能夠在擁有硬件之前就開始使用oneAPI編寫DG1相關的軟件。(校對/Humphrey)