微軟開源GraphRAG,可自動提取知識圖譜
品玩 / 洪嘉鎂編譯
2024-07-04 07:30

根據微軟官方消息,微軟現已在 GitHub 上開源一種基於圖形的檢索增強生成方法 GraphRAG,可在私有或先前未見過的資料集上進行問題解答。

相較於傳統的 RAG 方法,GraphRAG 能提供更有條理的資訊檢索和更全面的回應生成。作為 GraphRAG 程式碼庫的補充,微軟還提供了一個解決方案加速器,它提供了一種託管在 Azure 上的易於使用的 API 體驗,只需點擊幾下即可進行無程式碼部署。

GraphRAG 使用大型語言模型從任何文字文件整合中自動提取豐富的知識圖譜。這種基於圖的資料索引最令人興奮的功能之一是,它能夠在使用者查詢之前報告資料的語意結構。它以階層方式偵測密集連接節點的「社群」,在從高階主題到低階主題的多個層次對圖進行分割。使用 LLM 對這些社群中的每一個進行摘要,就能創造資料的階層摘要,從而提供資料集的概覽,而無需事先知道要問哪些問題。每個社群都是描述其實體及其關係的社群摘要的基礎。

本文為品玩授權刊登,原文標題為「微軟開源GraphRAG,構建知識圖譜增強大模型的問答、推理等能力