我們正在對 Gemini API 的檔案搜尋工具進行三項重大更新:支援多模態、自訂中繼資料和頁級引用。這些功能有助於開發者為非結構化資料帶來結構,以實現高效、可驗證的檢索增強生成(RAG)。

今天,我們正在擴展 Gemini API 的檔案搜尋工具。您現在可以使用多模態資料和自訂中繼資料來建構檢索增強生成(RAG)系統。我們還引入了頁級引用,以提高基礎資料的準確性和透明度。

無論您是為週末專案進行原型設計,還是為數千名使用者擴展生產應用程式,您的 RAG 系統現在都可以原生處理並更好地組織您的文字和視覺資料。

檔案搜尋現在可以同時處理圖像和文字。該工具由 Gemini Embedding 2 模型提供支援,能夠理解原生圖像資料,為您的代理程式提供情境感知能力。

想像一下一個創意機構試圖挖掘特定的視覺資產。您的應用程式不再依賴關鍵字或檔案名,而是可以搜尋整個檔案庫,尋找符合自然語言簡報中所描述的特定情感基調或視覺風格的圖像。

看看開發者們是如何使用它的:

將檔案傾印到資料庫很容易。大規模地找到正確的檔案才是真正的挑戰。自訂中繼資料允許您為非結構化資料附加鍵值標籤 — 例如 department: Legal 或 status: Final。

透過在查詢時應用中繼資料篩選器,您的應用程式可以將請求範圍限定在所需資料切片內。這大大減少了來自不相關文件的雜訊,提高了 RAG 工作流程的速度和準確性。

當您的應用程式從龐大的 PDF 中提取答案時,使用者需要驗證該答案確切來自何處。

檔案搜尋現在將模型的響應直接連結到原始來源。它會捕獲每條索引資訊的頁碼。這種粒度級別允許您直接將使用者指向正確的位置,這有助於建立信任,並使您的工具對於嚴格的事實核查立即變得有用。

我們希望盡可能輕鬆地儲存和檢索讓您的想法得以實現的資料。檔案搜尋工具負責繁重的基础設施,讓您可以專注於建構產品。

上傳檔案並在其中進行搜尋非常簡單:

在我們的開發者指南和 Gemini API 文件中探索更多程式碼片段,以了解如何使用檔案搜尋進行建構。

Gemini API 檔案搜尋現已支援多模態,助開發者打造高效、可驗證的 RAG 系統Gemini API 檔案搜尋現已支援多模態,助開發者打造高效、可驗證的 RAG 系統Gemini API 檔案搜尋現已支援多模態,助開發者打造高效、可驗證的 RAG 系統Gemini API 檔案搜尋現已支援多模態,助開發者打造高效、可驗證的 RAG 系統Gemini API 檔案搜尋現已支援多模態,助開發者打造高效、可驗證的 RAG 系統Gemini API 檔案搜尋現已支援多模態,助開發者打造高效、可驗證的 RAG 系統