Retool 的 2023 年度 State of AI 問卷調查:Atlas Vector Search 榮獲開發人員淨推薦值最高的殊榮

Mat Keep and Rachelle Palmer

Retool 就在剛剛發佈了其第一份 State of AI 報告,其中的內容非常值得各位研讀。State of AI 問卷調查乃是以廣受大眾認同的 State of Internal Tools 報告為基底所設計而來的問卷,並收集了來自各個產業 1,500 多名技術人員(舉凡:軟體工程、領導階層、產品經理、設計師等職務)所提供的業界資訊。該問卷調查的目的是要幫助大家瞭解這些技術人員究竟是如何使用並建構人工智慧 (Artificial Intelligence,簡稱 AI)的。

作為問卷調查的一部份,Retool 深入研究了哪些工具最受技術人員歡迎,其中的資訊包含了 AI 最常使用的向量資料庫。問卷調查發現,MongoDB Atlas Vector Search 在發佈後的短短五個月內就獲得了最高的凈推薦值(NPS),且是業界使用程度第二高的向量資料庫。MongoDB Atlas Vector Search 也因此能夠穩坐產業龍頭的寶座。

在這篇部落格文章中,我們將探討向量資料庫的驚人崛起,以及開發者是如何使用 Atlas Vector Search 等解決方案來建立 AI 驅動應用程式的。此外,我們還將向各位介紹 Retool 報告中的其他重點資訊。

歡迎各位查看我們的 AI 資源頁面,以瞭解更多使用 MongoDB 來建構 AI 驅動應用程式的相關資訊。

向量資料庫的採用量:破紀錄(幾乎啦⋯⋯)

從簡單的數理好奇心昇華成生成式人工智慧與大型語言模型的超能力,向量嵌入和託管這些機能的資料庫在極短的時間內就取得了長足的進步。

藉由查看 DB-Engines 過去 12 個月的資料庫模型趨勢,您會發現在受歡迎程度這一方面,向量資料庫的人氣度遙遙領先所有其他的資料庫。各位只要查看下圖中粉紅色線「穩定成長」的軌跡就能瞭解 DB-Engines 的人氣度有多高。

Screenshot courtesy of DB-engines, November 8, 2023

但是,向量資料庫究竟為什麼會變得這麼受歡迎呢?

在一種名叫檢索增強生成(Retrieval-Augmented Generation,亦稱作 RAG)的新興架構模式中,向量資料庫是個關鍵的組成元件;結合了預先訓練好之通用大型語言模型的推理能力與能夠即時接收公司自有資料特性,檢索增強生成就是這麼樣完善的工具組合。這樣的組合為公司企業帶來了能夠提供專門服務的 AI 驅動應用程式——無論是要創造全新產品、重新構想客戶體驗還是要盡可能提升內部團隊的生產力和效率,一切都能辦到。

向量嵌入是釋放 RAG 功能所需的基本元件之一。向量嵌入模型可以將企業組織的資料(無論是文字、程式碼、影片、圖片、音訊串流或表格)編碼為向量資料。然後,這些向量資料會被儲存在向量資料庫或向量搜尋引擎中供各位索引和查詢,並為選定的大型語言模型提供作為情境資訊的相關輸入資料。這樣 AI 應用程式便能以相關的企業資料和知識為基礎,對應準確、值得信賴且最新最即時的資料。

正如 Retool 問卷調查中的資料一樣,向量資料庫這個領域在很大程度上仍具備許多的可能性。目前,只有不到 20% 的受訪者有在使用向量資料庫,但隨著自訂模型和 AI 基礎架構的增長趨勢,向量資料庫的採用率勢必會有增長的趨勢。

為什麼開發人員應要採用 Atlas Vector Search 呢?

Retool 在 State of AI 問卷調查向各位展示了一些出色的向量資料庫,這些資料庫在過去幾年中為大家開闢了一條全新的道路,尤其是在需要情境感知語意搜尋機能、產品試想目錄或內容發掘的應用程式中。

然而,開發人員們在使用這些向量資料庫時所面臨的挑戰是:他們必須要將向量資料庫與其他資料庫一起整合到應用程式的技術堆棧中。

在應用程式技術堆棧中,每增加一個資料庫層,就會有可能會給自己額外增加技術複雜性、延遲或開銷。這意謂著技術人員們會有另外一個需要採購、學習、整合(用於開發、測試和生產)、保護和認證、擴展、監控和備份的資料庫;與此同時,開發人員們還要確保多系統間的數據資料能夠確實同步。

MongoDB 採取了不一樣的做法,並完全避免掉了上述的挑戰:

  • 開發人員直接在他們用作操作資料庫的同一系統中儲存並搜索原生向量的嵌入資料,無需另外再準備資料庫。

  • 透過 MongoDB 分佈式架構的使用,開發人員們可以在保持資料完全同步的前提下,隔離各種不同的工作負載。

  • 搜尋節點能提供特別配置的運算機能與工作負載的隔離選項,這對相當吃記憶體的向量搜尋工作負載來說至關重要,可以提高效能與可用性

  • 有了 MongoDB 靈活的動態文件模式,開發人員們便可以透過其他資料庫無法做到的方式來對向量、元資料和應用程式三者間的關係進行建模和改善的作業。

  • 透過有支援業界常見程式設計語言的強大查詢 API 與驅動程式,開發人員們可以根據應用程式本身的需求來有效處理並過濾向量/操作資料。

  • 使用完全託管的 MongoDB Atlas 開發人員資料平台讓開發人員們能夠實現應用程式使用者所期望的規模、安全性和效能。

這種整合後的選項會對開發人員們帶來什麼樣的變革呢?這個選項能為開發人員們帶來更簡短的開發週期與可提供低延遲和即時資料的高效能應用程式,並同時降低營運業務的開銷和成本。MongoDB 的同層級最佳 NPS 得分也反映了這樣的結果。

Atlas Vector Search 功能強大、成本效益高且速率極快!

Kovai 的 CEO Saravana Kumar 先生討論到其公司的 AI 助理開發進程

查看我們的 Building AI with MongoDB 部落格系列(前往「入門」的部份以查看過往的內容)。在這裡,您可以查看 Atlas Vector Search 是如何幫助各式採用 GenAI 技術的應用程式大放異彩,舉凡:聊天/語音機器人等對話式 AI、輔助副手、威脅情資和網路安全、合約管理、智能問答、醫療保健合規性和治療助理、內容發掘和營收管理以及諸多不同的應用領域。

MongoDB 已經有在我們的系統中儲存了有關成品的元資料。在 Atlas Vector Search 推出以後,我們現在擁有一個向量元資料的全面性資料庫,這個資料庫已經有接受了十多年的實務測試,可以幫助我們解決高度的檢索需求。無需另外部署一個我們必須託管和瞭解的全新資料庫。我們的向量和成品元資料可以存放在同一個資料庫中。

Pierce Lamb——VISO TRUST 的資料和機器學習團隊,高階軟體工程師

您可以從 Retool 的報告中瞭解到什麼樣的 AI 現狀資訊呢?

Retool 的問卷調查報告除了揭示了最流行的向量資料庫外,還從多個角度解讀了AI 的現狀。首先,該報告有探討受訪者們對 AI 抱持著什麼樣的看法。(不意外的是,高階管理職的人員所抱持的態度比個別貢獻人員樂觀。)然後,該報告還探討了投資的優先要點、AI 對未來就業前景的影響以及 AI 將會如何影響到開發人員和他們未來所需具備的工作技能。

接著,該報告也探討了眼下的 AI 採用程度與成熟度。有超過 75% 的受訪者表示他們的公司正在努力開始佈局 AI,另外有大約一半的受訪者表示這些專案還在早期的探索階段,主要應該還是會以內部應用為主。這份報告接著針對這些企業組織所提及的應用程式進行檢驗,並確認這些應用程式能夠為受訪者所屬的企業組織帶來多少效益。結果發現,無論是有意還是無意的,幾乎所有人在工作中都有使用到 AI,然後該報告也發現了 AI 應用眼下最大的痛點。毫無懸念的是,模型的準確性、安全性和幻覺,三者佔據了 AI 應用痛點的前三名。

最後,這份問卷調查報告也探索了目前業界最頂尖的模型。如大家所意料的是,Open AI 的產品/服務拔得頭彩,但該報告結果資料也表明:在未來,使用開源模型、AI 基礎架構與工具來安排自訂設定將會是一種趨勢。

您可以詳閱報告以深入瞭解所有的細節資料。

Atlas Vector Search 的入門資訊

想查看我們的 Vector Search 相關產品嗎?歡迎您前往我們的 Atlas Vector Search 產品頁面。在我們的 Atlas Vector Search 產品頁面,您可以找到教學、說明文件和 AI 生態系統之重點整合機能的網頁連結,好讓您可以直接開始研究該如何建構自己的 GenAI 驅動應用程式

如果您想瞭解更多關於 Vector Search 高階應用的資訊,請下載我們的《嵌入生成式人工智慧白皮書》(Embedding Generative AI whitepaper)。

請觀看我們的簡報《建構 2024 年度的 AI 藍圖》(Build Your AI Roadmap for 2024),以瞭解不同的 AI 使用案例以及企業組織該如何做出改變以支持 AI 的相關應用!