IBM發表首款7奈米AI晶片,加碼人工智慧基礎設施競爭
彭新 / 何渝婷編譯
2021-08-27 10:45

(圖片來源:IBM)

當人工智慧(AI)加速晶片已成為大型科技公司標配後,老牌科技公司IBM也給出了回應。在本週舉行的晶片產業會議HotChips上,IBM正式公布新款處理器「Telum」,Telum是IBM首款具有晶片上AI加速功能的處理器,用於IBM下一代Z系列大型機和LinuxONE伺服器。

IBM Telum包含8個處理器核心,頻率超過5GHz,每個核都由重新設計的32MB專用2級緩存支持。該處理器採用三星7奈米製程工藝,並且單晶片內採用17層金屬連接,來完成高密度電路互連,總線長可達約30公里。

為了支持AI加速處理性能,新處理器面積為530平方毫米,集成多達225億個電晶體,並擁有全新的分支預測、緩存,支持多晶片一致性互連,性能提升超過40%。

此外,IBM Z Telum處理器還採用雙向環形互連拓撲結構,頻寬接近320GB/s。三級緩存所有核心共享,通過二級緩存與核心相連,平均延遲達到12納秒(1納秒等於10的負9次方秒)。

IBM稱,新處理器通過晶片內深度學習推理(Inference) ,幫助即時解決金融客戶解決詐欺等問題,從而不需要將數據轉移至晶片外。AI計算大致分為兩個層面,首先是對模型進行訓練(training),整個過程可能耗時數天或數週;之後是訓練出的模型做出推理。

實際上,在晶片內集成和加強AI能力,IBM與英特爾思路一致,兩者均強調增強晶片的AI計算能力作為賣點。例如英特爾推出的第三代至強伺服器晶片,在深度學習方面增加了最新深度學習加速指令集,提高AI處理速度和模型計算精度。

IBM稱,其人工智慧硬體研究中心花了3年的時間研發打造出Telum處理器。打造出第一款結合AI加速推論功能的處理器晶片,用於大型機上時,可以協助銀行解決詐騙、高頻交易等金融難題,預計2022年上半年採用該晶片的大型機系統將會推出。

IBM介紹,金融企業可以將訓練完的AI或深度學習模型打包,到採用Telum處理器的IBM系統上來部署與進行AI推理,因此,可以就近執行AI與深度學習推論模型,例如運用AI提供金融詐騙偵測與分析,或利用機器學習,加快銀行貸款審核流程,還有處理高吞吐量的金融交易、反洗錢和風險分析等。

IBM Z產品管理資深副總Barry Baker在採訪中稱,雖然現今在銀行一些交易處理已有結合AI防詐偵測機制,但受限於CPU運算能力,僅針對部分高價值、高風險交易來使用,通過Telum,就沒有這個問題,可以對每筆交易進行偵測,確認所有交易都正常,防止漏網之魚。

在如火如荼的AI運算市場上,輝達憑藉GPU(圖形處理器)最先把握住了機會,成為AI企業幾乎不可或缺的晶片供應商。此後,晶片大客戶們更進一步,包括谷歌、阿里巴巴、亞馬遜、華為等廠商,爭相發佈AI訂製晶片,紛紛推出自研AI專用晶片,用於各項AI細分應用。

「在產業應用上,我們看到人工智慧的工作負載越來越複雜,AI模型處理體量正在急劇成長,計算量需求越來越大、功耗越來越高的現狀,試圖從因此通過訂製、專用的晶片來加速AI運算將是可行的。」一位IBM發言人表示 。

她還補充道,自2017年以來,AI晶片的運算效率每年提高2.5倍,這為IBM的晶片開發設立了性能基準,目標是在十年內繼續將AI硬體運算效率每年提高2.5倍,到2029年實現1000倍的性能提升。

本文為界面新聞授權刊登,原文標題為「IBM發佈首款7納米AI芯片,加碼人工智能基礎設施競爭