大型語言模型引發的 AI 大戰持續了兩年多之後,現在所有創業團隊和投資人都在問的一個問題是——適合大型語言模型的真正場景有哪些?或者更重要的是,到底該如何獲得貨真價實的客戶和營收?
當一般消費者仍然對對話式聊天助手感到興奮時,AI 公司早已在尋找 AI 的落地場景。例如,企業 SaaS 這個千億美元級的賽道上擠滿了 OpenAI、Anthropic、微軟等 AI 新貴和科技巨頭。
就在這樣擁擠的賽道中,一家名為 Glean 的公司,憑藉企業內部 AI 搜尋產品拿下了Sony電子、Databricks 等行業巨頭。
最近,這家剛成立 5 年的公司,在 D 輪融資中拿到了 Kleiner Perkins 和光速創投的 2 億美元巨款,公司估值暴漲至 22 億美元(約新台幣 700 億元),成為企業 AI 賽道當之無愧的領頭羊。
Glean 是如何做到的?它的企業 AI 搜尋產品,又有什麼與眾不同之處?
01 集中式 AI 搜尋平台
Glean 可以視為一個 AI 企業搜尋和知識管理的平台,主要功能包括:AI 搜尋、知識管理、工作首頁。
AI 搜尋是 Glean 最核心的功能,與傳統搜尋相比,它的優勢在於跨應用和個人化。
Glean 打造了一個深度整合的工作空間,為企業員工提供統一的介面,可存取企業所有的應用程式和服務,快速搜尋定位和整合零散的資訊,如會議記錄、支援票據、專案檔案等,極大提高了尋找資訊的速度。
舉例來說,使用者可以在 Glean 的平台上搜尋到 Slack 對話資訊、Google 文件內容和 Confluence 中的資訊等。
不僅如此,使用者還可以在 Glean 上執行與之連接的 SaaS 應用程式的輕量級功能,例如在 Glean 上直接啟動會議、建立 Jira 文件等等。
Glean 可以訪問企業 300+SaaS 產品|圖片來源:Glean 官網
在企業內部整合資料的基礎上,Glean 不僅整合了可實現「語意理解」的向量搜尋和關鍵字搜尋技術,還利用 LLM 推出了生成式 AI 的搜尋功能,並推出了 AI 助手。
Glean 的 AI 助手主要有三個功能:
1、AI 答案
Glean 的 AI 可以根據每位使用者的具體需求、偏好和存取權限,提供客製化的搜尋結果。例如不同職位、不同地理位置的員工搜尋自己的 OKR 指標時,Glean 會給到每個人不同的結果。Glean 還會利用員工的活動(如點擊搜尋結果)來提升搜尋的相關性。
2、專家偵測
當檢索不到資訊時,Glean 還能將員工與能夠協助回答問題或完成任務的人聯繫起來。
員工可以透過點擊「people」選項,尋找到與搜尋結果相關的內部「主題專家」。例如,當使用者想要搜尋「員工資料保留政策」的時候,該使用者可以透過「people」選項查找到工程安全部的相關負責人。
員工與能夠與可以説明回答問題或完成任務的人聯繫起來|圖片來源:Glean 官網
3、上下文推薦
使用者選中文件等某個內容後,輸入快捷鍵 Cmd-J / Ctrl-J 就可以查看這一內容相關的補充內容和上下文。
例如,當使用者在查看「供應商安全調查問卷」文件時,就可以輸入快捷鍵查看「銷售安全文件」、「常見安全問題彙整」等連結。
員工可以查看檔案|圖片來源:Glean 官網
此外,Glean 的 AI 助手還具有寫作和編碼助手的功能。例如,服務團隊可以使用 Glean 生成支援票據回覆。同樣地,它還能加快軟體開發任務的速度,如查找程式設計最佳實務和最近的程式碼變更資訊。
正如 Glean 創辦人 Arvind Jain 所說,「Glean 是一個面向公司所有資料的 AI 平台。你可以把它想像成你公司內部的 Google 或 ChatGPT,它可以根據公司內部資訊回答員工提出的任何問題,並引用來源。」
除了搜尋功能,Glean 還提供「知識管理」和「工作首頁」的功能。
「知識管理」指的是使用者可以分享和整合相關的文件或連結,使用全新簡短形式的 URL 進行介面跳轉等,以便更輕鬆地導航到常用資源。
使用 go/benefits 或 go/pitchdeck 代替記憶和搜尋長 URL||圖片來源:Glean 官網
而且,任何員工或團隊都可以為應用程式中的文件添加自定義的描述,便於他人快速了解文件並與他人分享。例如,HR 團隊可以將員工入職相關的文件和連結整合到一個專門的集合中,便於新員工更快地了解公司。
HR 團隊可以將入職相關的文檔和連結整合到一個專門的集合中|圖片來源:Glean 官網
「工作首頁」則是根據使用者的不同習慣,在首頁呈現個人化的功能模組,包括公司公告、員工目錄、行事曆等,使用者還可以將重要項目固定到搜尋結果的頂部。
可見,Glean 可以在一個集中的 AI 平台上連接、保護、索引和理解客戶的企業資料,這不僅極大地提升了資訊檢索的效率,還使得企業內部的資訊和知識更加易於管理和利用。
對此,Glean 創辦人 Arvind Jain 表示,「透過這些功能強大的更新,Glean 將企業搜尋提升到了一個新的層次。我們正在提供一種輔助系統,使企業使用者不僅能與公司知識保持聯繫,還能相互連結,從而在日益複雜的數位工作環境中推動前進。」
02 讓企業放心用 AI
Cisco(思科)最近的一項調查發現,超過四分之一的企業因隱私和資料安全風險而禁止使用生成式 AI。在民意調查中,企業表示他們擔心生成式 AI 工具會洩漏他們的智慧財產權或可能向公眾或競爭對手披露其他敏感資訊。
對此,Glean 公司執行長 Arvind Jain 表示,「企業領導者已經看到了 ChatGPT 在消費領域的威力,並渴望利用其潛力來顯著提高工作場所的生產力和績效。但企業資料非常複雜,需要克服的障礙很多,包括通用大型語言模型存在的幻覺和資料洩漏的風險。如果部署不當,就有可能犯下代價高昂的錯誤。它需要建立在正確的搜尋基礎上,才能真正發揮價值。」
他還補充道,「Glean 是唯一一家解決了如何將企業知識與 LLM 的推理能力結合起來,在工作中提供準確、安全的對話式 AI 體驗的公司。」
那麼,Glean 是如何做到「準確」、「安全」的?
答案是幫企業用自己的資料訓練企業專屬的生成式 AI 模型。
而這一模型的基礎就是 Glean 歷時 4 年研發的「可信知識模型」。該模型不僅了解搜尋內容,還了解上下文、人與人之間的關係、公司內部語言以及隱私和安全參數等,因此可以滿足與企業需求相匹配的準確性、安全性和參考能力。
「可信知識模型」圍繞三大支柱展開:
「可信知識模型」圍繞三大支柱展開||圖片來源:Glean 官網
1、公司知識和上下文:
Glean 透過 100 多個連接器,連接到客戶公司的所有應用程式,抓取資料來源,再透過把所有元資料編製索引,深度理解企業的內部語言、內部關係、內容活動等,為每個客戶建立了一個獨特的企業「知識圖譜」作為「搜尋索引」,從而確保搜尋答案的個人化和相關性。
「知識圖譜」不僅權衡了每條資訊之間的直接聯繫,還權衡了無數其他訊號和關係,比如能夠識別細微差別,這使搜尋引擎的知識更加完整,使生成式 AI 不斷學習和改進,提高搜尋相關性。
全面梳理並深度理解企業內部資訊的「知識圖譜」|圖片來源:Glean 官網
2、權限和資料管理:
Glean 的資料安全措施符合最高產業標準,客戶個人資訊的維護和保護符合歐盟《一般資料保護規則》(GDPR)的規定。
Glean 採用了準確的資料存取權限與資料加密。比如,Glean 遵守公司資料來源中設置的權限規則,會進行使用者存取審查以執行最小特權原則。這意味著,無論是 Slack、Teams、Jira、ServiceNow 等,員工都只能根據他們被授權存取的資料來獲取答案。
同時,Glean 透過對所有資料均使用 AES 256 進行靜態加密,所有資料在傳輸過程中均使用 TLS 1.2+ 加密等控制措施,來限制資料外洩風險。當使用者在底層應用程式中刪除文件時,該文件也會從 Glean 系統中同步刪除。
此外,Glean 還提供可擴展的基礎設施和稽核工具,以確保敏感資料按預期使用。
3、完全可參考性:
Glean 可以顯示每條資訊的來源以及每個回應是如何生成的。使用者可以清楚地知道每條資訊的來源,以及誰對此負責。
因此,當公司員工進行基於自然語言的查詢時,Glean 的 AI 助手會透過利用生成式機器學習模型,對其進行理解和分析,再使用公司專屬的 AI 搜尋引擎以及檢索增強生成(RAG:Retrieval-augmented Generation)技術來檢索最相關、最新的資訊,最後將這些資訊資料輸入大型語言模型(LLM),根據公司的內部「知識圖譜」,基於員工存取權限,為其提供「準確」、「安全」的搜尋結果。
儘管 Glean 正在混合使用大型語言模型輸出搜尋答案,包括 OpenAI 的 GPT-4 和 Google 的轉換器模型 BERT 等,但 Glean 官方表示,「鑑於企業的生成式 AI 模型是客製化的,因此企業的任何資料都不會被用於訓練這些公開的模型,並使外部組織受益,事實上根本不會被保留。」
可見,Glean 相當於一個既了解公司情況又了解每位員工偏好的助手,搜尋的回答是以「可信知識模型」為基礎,讓所有資訊都安全私密、準確可追溯。
不僅「準確」、「安全」,Glean 的部署使用也十分「方便」。
Glean 提供 Glean Apps 和 Glean API,企業用自然語言就能在任何需要的地方創建自定義 AI 應用程式,或者創建客製化的 AI 助手、協同機器人、聊天機器人和代理,並將其整合到他們的工作流程中,數天內即可投入運作。
Glean 還提供 Glean Apps 和 Glean API |圖片來源:Glean 官網
對此,Glean 創辦人 Arvind 表示,「Glean 的初步設置時間不超過兩小時,並且不需要任何工程技能或手動微調即可部署。無論是透過網路應用程式、新分頁、側邊欄搜尋、原生搜尋還是 Slack 命令,Glean 都提供了無縫的工作流程整合。」
「我們相信,擴大人工智慧生成體驗以促進資訊存取和探索,是為企業環境釋放全部潛力的第一步。Glean 站在領域內訓練模型和微調 LLM 的前沿,為這一進步提供動力。」
03 擁擠的企業 AI 賽道
Glean 由雲端資料管理公司 Rubrik 的共同創辦人 Arvind Jain 發起,其靈感來自於 Jain 的觀察:Rubrik 的員工經常難以找到工作所需的資訊,其他公司的員工也因同樣的問題而苦惱。
2019 年,Jain 與 Google、微軟和 Meta 的前員工一起組建了一個小型創始團隊,在矽谷中心帕洛阿爾托,建立了面向企業客戶的 AI 搜尋應用 Glean。
Glean 的聯合創始人|圖片來源:Glean 官網
隨著生成式 AI 的發展,Glean 成長轉型為業界領先的生成式 AI 解決方案提供商,致力於「為人們提供改變世界所需的知識」。
事實上,企業搜尋在市場上並不是一個全新的概念,Glean 有不少競爭對手,主要包括一些提供類似服務的大公司和其他新創公司,像是 Microsoft SharePoint Syntex、Amazon Kendra、Google Cloud Search、Coveo、Elastic、Lucidworks 等。
但是,Glean 首次成功建立了全面解決方案,透過其獨特的 AI 模型和個人化服務,在簡化部署和操作流程方面領先於這些競爭對手。
Glean 商業模式為純 ToB 的模式,並向企業客戶提供了兩種不同的計費方式。
一種是基於每月每位使用者(per-seat)的收費模式,每位使用者的費用大約不超過 100 美元。另一種則是基於年度合約的客製化企業解決方案,這種合約的總金額一般介於 5 萬到 10 萬美元之間。值得一提的是,對於選擇後者的客戶,Glean 通常會提供一定的折扣,使得整體方案更具成本效益,因此也更受到客戶的青睞。
此外,Glean 與 Google Cloud Platform (GCP) 建立了合作關係。在企業客戶向 Glean 支付的費用中,有一部分是用於支付給 GCP 的費用。這筆費用相對固定,不會因為使用者數量的增加而有顯著變化,類似於一種基礎成本,每月大約在 1,000 到 2,000 美金之間。
目前,Glean 已經擁有 70 多家客戶,從新創企業到財富 500 強企業,遍及科技、媒體、教育和醫療保健等多個產業。
Glean 的客戶|圖片來源:Glean 官網
Glean 也自然成了資本的寵兒,投資方包括 Kleiner Perkins、紅杉資本、Lightspeed、Latitude Capital 等,到目前為止,Glean 成功進行了 4 輪融資,共融資 8.5 億美元,估值高達 22 億美元。
Glean 的投資方|圖片來源:Glean 官網
關於 Glean 的未來,Glean Technologies 創辦人 Arvind Jain 表示,「如今,AI 的作用就是幫助你獲取所需的資訊。但很快,它的功能會更加強大,會轉變為與你合作的 AI。你會看到各種各樣的聊天機器人和系統,我們將生活在一個人工智慧為我們工作的世界裡。」
只用 5 年時間就做成了一家估值超過 20 億美元的公司,Glean 無疑是成功的。但不得不說,2019 年時生成式 AI 尚未像現在這麼火熱。事實上,不只矽谷,在全球範圍內都已經出現非常有實力的競爭者,這其中既有 OpenAI 這樣的消費、B 端兩手抓的公司;也有微軟這樣的商業軟體巨頭,更別說身後一堆 AI 新創公司。
作為領頭羊,Glean 如何保持自己的優勢、擴大在企業市場的影響力,是個讓人萬分期待的問題。
本文為AI新智界授權刊登,原文標題為「5 年 160 億估值,矽谷「企業 AI」領頭羊怎麼做到的?」