頁面標題:仰賴 MongoDB Atlas 與大型語言模型,從無到有達成企業就緒目標

David Macias

透過蘊含生成式 AI 的應用程式,為您的客戶打造引人入勝、實現真正差異化的體驗,這也意味著 AI 是一種以事實為基礎的先進技術。而這項事實正是源自於您的資料,更具體地說──是源自於您的最新營運資料。無論您是透過進階語意搜尋提供超個人化體驗,還是生成使用者提示的相關內容和對話,MongoDB Atlas 都能統一操作、分析和進行向量搜尋資料服務,簡化將大型語言模型和轉換器模型的強大功能嵌入您的應用程式。

每天,開發者都致力於打造下一個由充滿開創性和變革性的生成式 AI 驅動的應用程式。商業活動和開源大型語言模型更以驚人的速度持續進步。圍繞它們建構出的框架和工具相當豐富,同時實現了創新民主化。然而,要將這些應用程式從原型轉變為企業就緒目標的階段,正是開發團隊必須跨越的技術鴻溝。首先,這些大型模型可能會提供錯誤或答非所問的答案,原因在於它們存取的資料早已過時。目前有兩種選擇可解決大型模型回應答非所問的答案,其中包括微調大型模型或提升長期記憶。然而,這麼做便會產生第二道障礙──圍繞著知識廣泛的大型語言模型部署應用程式,並採取正確的安全控制措施,進而達到使用者期望的規模和性能。

開發者需要的是一個具有資料模型靈活性的資料平台,以適應不斷演變的非結構化和結構化資料,進而在不受僵化模式阻礙的情況下,為大型模型提供資訊。儘管微調模型只是其中一種選擇,但考量到時間成本和運算資源,這也為一種成本高昂的選擇。這意味著開發者需要能將資料視為大型模型的上下文呈現,並作為提示的一部分。對此,他們便需要賦予這些生成式模型長期記憶。以下我們將探討幾個範例,進一步了解如何使用各種大型語言模型和生成式 AI 框架來實現這一點。

歡迎各位查看我們的 AI 資源頁面,以瞭解更多使用 MongoDB 來建構 AI 驅動應用程式的相關資訊。

快速入門 MongoDB Atlas 和大型語言模式的 5 個資源

MongoDB Atlas 可以無縫集成多項引領業界的生成式 AI 服務和系統,例如超大規模供應商、開源大型語言模型和框架。透過 Atlas DatabaseAtlas Vector Search(預覽版)將文件和向量嵌入資料儲存於同一個地方,如此一來,開發者便能加速建構蘊含基於營運資料真實性的生成式 AI 應用程式。以下是如何使用現正流行的大型語言模型框架和 MongoDB 操作的範例:

1. 使用 Atlas Vector Search(預覽版)和 OpenAI 執行語意搜尋

本使用教學將引導您完成使用 MongoDB Atlas 對範例電影資料集執行語意搜尋的步驟。首先,您需要設置一個 Atlas 觸發器,以便在每次將新文件插入叢集時調用 OpenAI API,進而將其轉換為向量嵌入。然後,您將使用 Atlas Vector Search 執行向量搜尋查詢。甚至還有一個利用 HuggingFace 模型的特別獎勵環節。閱讀使用教學文章

2. 使用 Llamalndex 和 MongoDB 並透過您的專利資料建構蘊含生成式 AI 的聊天應用程式

LlamaIndex 提供了一個簡單靈活的介面,可以將大型語言模型和外部資料互相連接。在 LlamaIndex 和 MongoDB 的共同部落格中,詳細介紹了您為何需要以及您應該如何建構專屬的聊天應用程式。部落格中隨附的筆記本則提供了有關如何使用英語版本的語言查詢功能來查詢任何 PDF 文件的程式碼演練資訊。閱讀部落格文章

3. 參閱文件來了解如何使用 Atlas Vector Search(預覽版)作為 LangChain 的向量儲存

一如合作夥伴公告部落格文章中所述,LangChain 和 MongoDB Atlas 堪稱絕佳拍檔組合,而社群的熱烈討論就是最好的證明,正是這股熱情促成 LangChain for MongoDB 的多次集成。除了目前支援 Atlas Vector Search 作為向量儲存之外,也支援使用 MongoDB 作為儲存聊天日誌歷史記錄的媒介。閱讀文件:pythonjavascript

4. 使用 MindsDB AI 集合直接在 MongoDB Atlas 中生成各項預測

MindsDB 是一個開源機器學習平台,它會將自動化機器學習引入資料庫。在本部落格文章中,您將使用 MindsDB AI 集合功能直接在 MongoDB Atlas 中生成各項預測,讓您能將這些預測作為常規資料使用和查詢用途,並透過簡化部署工作流程來加快開發速度。閱讀部落格文章

5. 使用 Atlas 觸發器將 HuggingFace 轉換器模型集成至 MongoDB Atlas

HuggingFace 是一個 AI 社群,可以輕鬆建構、訓練和部署機器學習模型。只要善加利用 Atlas 觸發器和 HuggingFace,便能輕鬆應對營運資料的各項變化,讓您的模型提升長期記憶。歡迎進一步了解如何設定 Atlas 觸發器自動預測 MongoDB 資料庫中新文件的情緒分析,並將其作為附加欄位新增至文件中。參閱 GitHub 儲存庫

影像區塊:圖 1:範例應用程式架構顯示了外部或專利資料如何讓大型語言模型提升長期記憶,以及資料如何經由使用者的輸入轉移至由大型語言模型支援的回應。

從原型到生產,透過 MongoDB 建構適用於蘊含生成式 AI 的應用程式

MongoDB 是以 MongoDB Atlas 為基礎建構的開發者資料平台,該平台提供了現代化、最佳化的開發者體驗,並歷經全球數千家企業的實戰測試,確保能夠大規模、安全地執行任何管理操作。

無論您是在新創公司或大型企業策劃佈局下一件大事,MongoDB Atlas 都能讓您:

  • 加速建構蘊含基於營運資料真實性的生成式 AI 應用程式。

  • 利用單一平台簡化您的應用程式架構,該平台允許其將應用程式和向量資料儲存於同一個地方,並使用無伺服器功能應對來源資料的變化,並跨多種資料模式進行搜尋,提升應用程式生成回應的相關性和準確性。

  • 透過文件模型的靈活性,輕鬆發展蘊含生成式 AI 的應用程式,同時保有簡單優雅的開發者體驗。

  • 無縫集成引領業界的 AI 服務和系統,例如超大規模供應商、開源大型語言模型和框架,以在瞬息萬變的市場競爭中站穩腳步。

  • 在具有高性能、高度可擴展性的營運資料庫中建構生成式 AI 的應用程式,該資料庫已在廣泛的 AI 使用案例中歷經 10 年的實戰驗證。

儘管這些範例是更具創新性的建構區塊,但 MongoDB 可幫助您從概念到生產再到規模化的全面性部署。立即註冊 MongoDB Atlas,即可部署免費層級,並與您首選的框架和大型語言模型互相集成。如果您有興趣與我們攜手合作,歡迎查看我們的 MongoDB AI 創新者計劃,這項計劃大力扶持 AI 創新,並展示來自新創公司、客戶與合作夥伴的頂尖技術解決方案。