(取自OpenAI twitter)
昨日中午,一則ChatGPT Plus停售的消息在科技圈引發震動,據量子位等媒體報導,OpenAI暫停了Plus的銷售,ChatGPT已不支持Plus付費,之後何時開放也未可知。
幾位用戶告訴界面新聞,昨天確實發生了ChatGPT Plus的停售,這些用戶包括售賣ChatGPT帳號的中間商和賣虛擬信用卡的中間商。
今日早間,多位用戶告訴界面新聞,ChatGPT會員可以正常升級到ChatGPT Plus,升級後功能一切正常。
算力告急?
ChatGPT Plus的推出是為了用戶可在ChatGPT高峰時段優先使用,獲得更迅速的服務響應,因此,付費的ChatGPT Plus相對於免費的ChatGPT而言,擁有更大的模型容量、更先進的訓練和更好的預處理,在使用上能夠更加快速高效地處理輸入並完成輸出。
OpenAI是在今年2月1日發布了ChatGPT Plus訂閱計劃,ChatGPT Plus每月收費20美元。
ChatGPT Plus的強大功能是基於GPT-4模型而生,而此前風靡全網的ChatGPT使用的是GPT-3.5模型,更強大的模型就意味著更大規模的算力。
目前,大模型算力成本主要有初始訓練成本和後續營運成本兩部分,東吳證券對GPT模型所需的算力作了測算:在GPT-3模型初始訓練階段,根據OpenAI官網數據,每個token(token是服務端生成的一串字符串, 以作客戶端進行請求的一個令牌)的訓練成本通常約為 6N FLOPS(FLOPS 指每秒浮點運算次數,可理解為計算速度,可以用來衡量硬件的性能), 那麼OpenAI對ChatGPT的初始訓練成本需要843顆輝達A100晶片。
當進入營運階段,由於這個階段所需算力量與使用者數量緊密相關,東吳證券作出假設,如果GPT-3每日有5000萬活躍用戶,每個用戶提10個問題,每個問題回答400字,則這個階段需要16255顆輝達A100芯片。
根據ChatGPT Plus的收費金額,東吳證券推論,GPT-4的參數量是GPT-3的10倍以上,因此預計GPT-4的算力需求是GPT-3的10倍以上。
此等算力規模需求,自然會引發算力告急的猜想,隨著用戶需求量超過預期,OpenAI很可能採取一些方式來減少對ChatGPT的訪問,比如從3月31日開始,ChatGPT開始集中在亞洲地區大規模封號,據各方消息匯總,這次封號受到影響的帳戶多達百萬。
OpenAI想藉ChatGPT Plus作為打開豐富商業模式的開端,但在現實階段體驗中,無論是ChatGPT還是ChatGPT Plus,都存在顯著的相應延遲和回答錯誤率提升等問題。
3月下旬開始,OpenAI對於Plus付費用戶的訪問連續下降閾值,其應用模型GPT-4訪問限制由第一天的150msg/4hr到100msg/4hr到50msg/3hr直到最近的25msg/3hr,相當於不到一個月連續下降了4次訪問閾值,這都被視為算力不足的體現。
不過,也出現了專業聲音認為,算力並非大模型發展和功能體驗的真正瓶頸。
氪信科技創辦人兼CEO朱明傑告訴界面新聞,他並沒有把算力問題太當成瓶頸,做大模型,最先解決的是最終結果的問題。
氪信科技是將搜尋引擎級別的大規模機器學習技術,用於金融領域的最早一批人工智慧公司,朱明傑告訴記者,「用第一性原理來說,本質上OpenAI解決的問題是如何把這麼大體量的數據壓縮到模型裡面去,變成知識的問題,這才是它的終極目標,中間算力到底用A100還是A800,用的是GPU架構還是CPU架構,反而都是可解的事情。」
事實上,此番撲朔迷離的ChatGPT Plus停售事件,是近日「唱衰ChatGPT大合唱」的最新樂章。
剛剛,加拿大和德國加入了義大利的「反感ChatGPT」陣營,當地時間4月4日,加拿大隱私專員辦公室(OPC)宣布開始調查ChatGPT背後的公司OpenAI,涉及「指控OpenAI未經同意收集、使用和披露個人資訊」的投訴。
據路透社消息,德國聯邦數據保護專員Ulrich Kelber在4月3日發表的評論中告訴德國《商報》,德國可能會追隨義大利的腳步,因數據安全考量而「封殺」ChatGPT。
3月底,義大利個人數據保護局宣布,即日起暫時禁止ChatGPT的使用,同時對OpenAI展開調查,限制其處理意大利的用戶資訊。
該機構認為,3月20日ChatGPT平台出現了用戶對話數據和付款服務支付信息丟失情況。
此外,平台沒有就收集處理用戶資訊予以告知,缺乏大量收集和儲存個人資訊的法律依據。
兩天後,OpenAI執行長Sam Altman回應稱這是一個重大問題,「我們對此感覺很糟糕。」他表示,將會遵從義大利政府的要求,並已停止在義大利提供ChatGPT,儘管其認為自身遵守所有的隱私法。
而在義大利對ChatGPT做出封禁決定前兩天,馬斯克率一眾科技圈大佬呼籲暫停高階AI系統訓練,其所發表的一封公開信引發了軒然大波。
信中指出,「只有在我們確信強大的人工智慧系統的效果將是積極的、風險是可控的,才應該開發。」
數據才是關鍵
縱觀近期圍繞ChatGPT的爭議事件會發現,表面看,算力是影響OpenAI發展的瓶頸,但事實上,數據才是OpenAI能否繼續發展的助力和關鍵。
「算力的擴容目前不會是提供服務的瓶頸,不難克服。」北京師範大學法學院博士生導師、中國互聯網協會研究中心副主任吳沈括對界面新聞表示。
「ChatGPT們當然需要新的監管規則,但現行的法規依然有效,在這個意義上,從數據切入是目前最扎實有效的監管方式。」吳沈括表示,無論是義大利、德國還是加拿大,他們本次監管切入點都是數據流轉。
「不過,義大利等國針對ChatGPT的監管舉措到目前為止,都不能得出技術本身是違法的結論。」吳沈括強調。
吳沈括進一步分析了歐美在ChatGPT監管中的不同站位,他指出,歐洲有嚴格的數據法規,從數據流轉角度切入得心應手,能夠反映歐洲關於數位主權、技術主權的核心立場,特別是針對美國企業,「這裡有一個數位經濟、數位發展的主導權問題。」
他判斷歐洲各國效法跟進的可能性較大,而美國方面,由於處於技術先發的優勢地位,對ChatGPT們的監管思路會更為寬鬆。
「美國和其他國家的監管思路必然出現明顯差異,因為這種技術存在本身,能放大其已有的數據優勢、算力優勢和算法優勢。」吳沈括直言。
他預計此後,ChatGPT們運算處理過程中的規則透明度、可解釋性,會成為監管關係的重點。
「這裡面的要害是數據收集匯聚,是否具有合法性,是否取得了當事人同意,是否屬於違法爬取數據;第二是加工處理角度,是否有超過、超越權利人授權;第三,關於數據處理運算結果的輸出,是否符合倫理的要求,法律規則和安全的要求,是否會帶來危害社會和公眾利益的結果。」吳沈括從三個層次概括了ChatGPT們要度過目前數據屏障的關鍵。
在移除數據屏障的過程中,OpenAI可能還面臨著一樁難題。
OpenAI已經面臨與自己的金主微軟之間尷尬的客戶競爭,很多企業級客戶開始在OpenAI和Azure OpenAI中進行權衡。
有觀點指出,OpenAI已經向Azure保留了一些模型,迫使很多公司直接和OpenAI合作,比如3月1日開始,OpenAI對外銷售其語音辨識模型Whisper的訪問權限,目前該模型仍不可用於Azure OpenAI服務。
亞洲地區大規模封號事件開始後,OpenAI的系統出現了部分問題,而微軟的Azure雲端上所提供的OpenAI相關服務仍然保持穩定,客戶還可在運行與OpenAI相同的模型時獲得Microsoft Azure的安全功能。
安全性,已成為微軟從OpenAI手上搶奪客戶的一大優勢。
接下來,OpenAI需要在紛繁複雜的線頭中釐清製約發展的真正瓶頸在哪兒,OpenAI的聯合創辦人John Schulman給別人提出的建議也適用於其自身:選擇去解決什麼問題的能力比你本身擁有的技能更重要。
本文為界面新聞授權刊登,原文標題為「ChatGPT Plus停售風波:算力不足是偽命題,數據才是關鍵」