Meta錯失良機?前員工創立的AI公司可能將改寫生物科技產業未來
元宇宙之心MetaverseHub / 洪嘉鎂編譯
2024-07-08 14:00

(示意圖/取自pixabay)

一週前,在Meta如火如荼地捲入文字生成影片賽道的時候,那個被它解散的蛋白質團隊EvolutionaryScale獲得了超過1.42億美元的種子輪融資,這個融資額在整個生物技術領域都可以說是高得離譜。

去年八月,Meta官方宣布旗下的蛋白質摺疊團隊Meta-FAIR解散。這個純粹的「科學+AI」專案並不能讓Meta快速獲得收益,Meta專注商業化AI的決定看似也是情理之中。

然而,這個不被看好的團隊竟用僅僅一年的時間就打了Meta的臉。他們最新推出的ESM3被認為是生物學領域具有里程碑意義的生成式AI模型,為生物學程式設計開創了新的可能性。

1分鐘專案快速導覽

名稱:EvolutionaryScale

成立時間:2023年7月

產品簡介:開發用於創造新型蛋白質和其他生物系統的大型語言模型——ESM,目前已迭代到ESM-3。

創始人團隊:首席科學家:Alexander Rives(紐約大學計算機科學博士、前Facebook AI科學家)、Tom Sercu、Sal Candido

融資情況:2024年6月25日完成了高達1.42億美元的種子輪融資。本次融資由Nat Friedman和Daniel Gross以及Lux Capital領投,亞馬遜、NVentures(輝達的風險投資部門)和天使投資人參與投資。

團隊協同一致的理念追求

人工智慧的進步為生物科學研究創造了前所未有的機會,包括設計功能性生物分子,尤其是蛋白質。將人工智慧運用於蛋白質設計,不僅可以提升蛋白質設計的效率及成功率,還透過快速應對傳染病爆發等方式,來幫助人類解決一些正在面臨的挑戰。

Alexander Rives等人正是看到了蛋白質設計方面的缺口,決定開發基於深度學習的大模型,從而推動產業級蛋白質設計進入「全自動智慧生成時代」。

於是,EvolutionaryScale應運而生。它是一家專注於生物科學領域的第一線AI研究實驗室,致力於推出生物學第一線的語言大模型。

有趣的是,該公司創始團隊的八位成員全都來自於Meta的FAIR(基礎人工智慧研究)部門。儘管在世界級的社群媒體巨頭那裡吃了虧,但創始團隊的核心人員都沒有放棄,反而快速地投入新戰場,開始在原有團隊成果的基礎上開發下一代模型。

EvolutionaryScale的大模型支援健康、環境科學等領域的研究與開發,不停探索生物學的擴展性,為突破性的科學研究提供動力。其中最顯著的成果就是蛋白質摺疊技術的突破,ESM模型揭示了數億個宏基因組蛋白質的結構,幫助世界各地的科學家來模擬和理解蛋白質。

EvolutionaryScale旨在透過開放、安全的研究方式,來指導蛋白質設計領域的人工智慧技術開發。

在此基礎上,該公司作為簽署方,引領了超過160位來自學術界、政府以及民間的全球利益相關者,共同發展這項技術,確保其安全可靠,從而達成造福人類健康和社會的願景。

正是由於懷著引領生物學界先進AI技術的責任感,Alexander Rives和他的團隊從未停止腳步。

此前,EvolutionaryScale曾發布過大型語言模型ESM1,這被認為是第一個用於蛋白質的transformer語言模型,由EvolutionaryScale的創始團隊在Meta的FAIR部門工作期間所建構。作為ESM1升級模型的ESM2擁有1500萬個參數,並且相較於舊模型ESM1b(擁有6.5億個參數)表現更佳。

先前,EvolutionaryScale發布了最新的ESM3 AI模型,這是朝著生物學的未來所邁進的一大步。憑藉這種模型的能力,有可能會加速廣泛應用的發現,有利於創造有助於捕獲碳的蛋白質,從而開發出新的癌症治療方法。

AI在生物學應用的先驅

ESM3是一個生成式的AI模型,主要功能是生成新型蛋白質。該模型通過深度學習技術,使用大量的蛋白質資料進行訓練,從而學習蛋白質的序列、結構和功能之間的關係。

ESM3的訓練使用了超過1萬億teraflops的計算能力,這是目前已知生物學領域中最大的計算規模。它在地球上自然多樣性的27.8億種蛋白質資料集上進行了訓練,使其能夠同時對蛋白質的序列、結構和功能進行推理。

ESM3的主要工作流程可簡略為以下四個步驟:

資料收集與處理:EvolutionaryScale首先會從各種來源收集大量的生物學資料,包括基因序列、蛋白質結構、功能註釋等。這些資料會經過清洗、標準化和格式化處理,以便於後續的分析和應用。

模型訓練:使用深度學習演算法和大量的計算資源,EvolutionaryScale會對處理後的資料進行訓練,建構出能夠理解和預測生物學規律的大型語言模型。這些模型不僅具有高度的準確性,還能夠處理複雜的生物學問題。

生成新蛋白質:通過互動式提示,ESM3能夠生成新的蛋白質,這些蛋白質可能在自然界中需要數億年才能進化出來。

科學驗證:生成的新型蛋白質將通過科學實驗進行驗證,以確定其功能和潛在應用。

目前,ESM3最引人注目的使用案例之一是生成了一種新的綠色螢光蛋白(GFP)。

GFP是自然界中最美麗和獨特的蛋白質之一,負責水母的發光和珊瑚的鮮艷螢光色。ESM3透過一系列思考過程,跨越了5億年的進化,創造了這種新的螢光蛋白。這一過程在自然進化中可能需要超過5億年,而ESM3通過計算方法實現了這一飛躍。

ESM3的發布也為藥物發現和合成生物學領域帶來了革命性的變化。

在藥物發現方面,ESM3能夠生成具有特定生物活性的新型蛋白質,為藥物篩選和優化提供了更多的候選分子。同時,ESM3還能夠預測和最佳化藥物與靶點的相互作用機制,為藥物的設計和開發提供更加科學的依據。

在合成生物學方面,ESM3能夠生成具有特定功能的生物系統,為生物製造和生物能源等領域提供了新的解決方案。例如,ESM3可以生成出將二氧化碳高效轉化為有機物的酶系統,為碳捕獲和利用提供了新的途徑。

EvolutionaryScale的ESM3模型代表了AI在生物學領域的新里程碑。透過其強大的生成能力和與產業領導者的合作,ESM3有望加速新型蛋白質的發現和生物系統的設計,為未來的藥物開發、材料科學和環境科學等領域帶來革命性的影響。

生物學領域創新之旅

合成生物學:程式設計生命

合成生物學是EvolutionaryScale未來發展的一個重要方向。透過設計和合成新的基因電路和生物路徑等方式,科學家們可以創造具有特定功能的生物體。

基因電路類似於電子電路,但它們在細胞中控制生物學過程。

基因電路能夠在細胞內實現對特定基因表達的精確控制。例如,可以設計一個基因電路,使其在細胞檢測到特定訊號(如某種化學物質或環境變化)時啟動或關閉特定基因的表達。

合成生物路徑涉及多種酶和代謝途徑的組合,用於生產有價值的化合物。

透過AI分析和設計,科學家可以創造新的代謝途徑,使生物體能夠合成天然條件下無法產生的化合物。例如,透過重新設計微生物的代謝路徑,微生物可以生產出醫藥中間體、生物燃料或工業化學品。

細胞工廠是通過基因工程手段改造微生物,使其在工業條件下高效率生產目標產品的生物系統。

透過AI輔助設計,科學家可以改造微生物的基因組,使其在特定條件下表現出優異的生產性能。例如,通過編輯酵母或細菌的基因,科學家可以使這些微生物高效率生產抗生素、酶或其他生物製品。

若此項技術能繼續發展,不僅將推動科學研究的前沿發展,還能為醫藥、環境保護和農業等領域帶來重要的應用前景。

資料驅動的個人化醫療

EvolutionaryScale正透過AI和大數據分析技術推動個人化醫療的進步,為患者提供更加精準和高效的醫療服務。

個性化醫療是基於每個患者的獨特生物學資訊和臨床資料,量身訂製最合適的治療方案。其中一個關鍵領域是基因組分析。透過對患者的基因組進行全面測序和分析,科學家可以識別出與疾病相關的基因變異。

EvolutionaryScale利用AI技術,快速準確地解析大量基因組資料,從中發現潛在的疾病風險因素。

這種方法可以幫助醫生在疾病的早期階段做出診斷,並採取預防措施。例如,透過分析乳腺癌患者的BRCA1和BRCA2基因突變,可以預測其患病風險,從而進行早期篩查和干預。

如今,EvolutionaryScale正站在生物學與人工智慧融合的第一線,通過不斷創新和探索,致力於完成生物系統的程式設計和最佳化。後續可能會發展更多技術性的突破,為人類開創一個更加智慧和健康的未來。

本文為AI新智界授權刊登,原文標題為「打臉Meta還獲得英偉達加持? 被解散的原Meta AI蛋白質團隊最新融資1.42億美元