亞馬遜AWS發表新晶片,加碼雲端基礎設施競爭
彭新 / 何渝婷編譯
2021-12-02 07:27

由於伺服器晶片戰略獲得成功,亞馬遜雲端運算部門(AWS)正在乘勝追擊。

台灣時間12月1日,全球最大的雲端廠商亞馬遜雲端科技,在re:Invent大會上發表了公司訂製設計的雲端晶片Graviton 3和Trainium,稱除了使用成本低外,效能也更加優化。

Graviton 3是亞馬遜雲端科技Graviton系列的最新一代晶片,基於Arm架構。

據稱,較前一代Graviton 2相比,通用運算力約可以高出25%。但如果特別專注在科學領域、加密領域等使用浮點運算的話,性能最快可達2倍,若是機器學習的話甚至能支持多達3倍性能,且節能最高可達60%。

亞馬遜彈性運算雲端副總裁Dave Brown表示,預計Graviton 3的性價比將大大超過英特爾晶片。目前,雲端CPU絕大部分都是英特爾X86架構的處理器。

Trainium晶片專供機器學習訓練(Training)任務,該晶片主要用於訓練機器學習運算模型,並針對圖片分類、語義搜索、翻譯、語音辨識、自然語言處理、推薦引擎等深度學習訓練工作進行了優化,成本較輝達的旗艦GPU晶片低40%,預計在不久後推出。

AI運算大致分為兩個層面,首先是對模型進行訓練(training),整個過程可能耗時數天;之後是訓練出的模型響應實際請求,做出推理(inference)。

目前,輝達旗下的GPU(圖形處理器)佔據訓練市場,多數推理任務則仍由傳統的英特爾CPU承擔。

此前亞馬遜雲端科技已推出基於機器學習推理的伺服器晶片Inferentia,支持主流深度學習框架,包括谷歌開發的TensorFlow、Facebook開發的PyTorch和MXNet等。

至此,亞馬遜雲端科技對雲端機器學習運算進行了完整的晶片佈局。亞馬遜雲端科技大中華區產品部總經理顧凡解釋稱,Trainium和Inferentia是相輔相成的晶片,可以為客戶提供從推理到訓練一整套端到端的機器學習運算流程,而且由於Trainium和Inferentia共享相同的神經網路SDK,原本就熟悉Inferentia的開發者很快就能上手Trainium。

不過,亞馬遜雲端科技仍與英特爾、AMD和輝達保持合作,比如其將Graviton處理器與輝達GPU搭配使用,為安卓遊戲開發商服務。在大會上,亞馬遜雲端科技還宣布採用AMD第三代伺服器晶片。

但即使使用輝達或AMD的晶片,即使算力足夠快,亞馬遜雲端科技仍然認為,在機器學習端,訓練持續變大的AI模型仍然是非常昂貴和耗時的,自己需要向上游延伸。

亞馬遜雲端科技將其運算能力出租給客戶,如今已成為世界上最大的雲端運算服務提供商,也是伺服器晶片最大買家之一,其2020年銷售額達453.7億美元。2015年,亞馬遜雲端科技收購了以色列晶片公司Annapurna Labs,目的就是為了設計訂製化晶片,來支持不同的雲端服務需求,上述的Arm晶片和AI晶片都得益於這一收購。

本次re:Invent大會上,亞馬遜雲端科技除了發表Graviton 3和Trainium兩款邏輯晶片外,還有一款SSD(固態儲存驅動器,即固態硬盤)產品,用於雲端的數據儲存和讀寫。

晶片產品發表後,亞馬遜盤前股價上漲1.22%,至每股3550美元。

本文為界面新聞授權刊登,原文標題為「亞馬遜雲科技迭代服務器芯片,加碼雲基礎設施競爭