Ridefinire il database per l'IA: perché MongoDB ha acquisito Voyage AI
February 24, 2025 | Updated: March 11, 2025
#ArtificialIntelligence
L'AI sta rimodellando i settori, ridefinendo le esperienze dei clienti e trasformando il modo in cui le aziende innovano, operano e competono. Sebbene gran parte dell'attenzione sia rivolta ai modelli di frontiera, una sfida fondamentale risiede nei dati: come vengono archiviati, recuperati e resi utili per le applicazioni di intelligenza artificiale. La democratizzazione dei software basati sull'AI dipende dalla pratica di sviluppare sulle astrazioni corrette, tuttavia oggi creare applicazioni AI utili e in tempo reale su larga scala non è fattibile per la maggior parte delle organizzazioni.
La sfida non rappresentata solo dalla complessità, ma anche dalla fiducia. I modelli di AI sono probabilistici, il che significa che i loro risultati non sono deterministici e prevedibili. Questo aspetto è facilmente ravvisabile nel problema delle allucinazioni nei chatbot odierni e diventa ancora più critico con l'ascesa degli agenti, dove i sistemi AI prendono decisioni autonome. I team di sviluppo devono avere la capacità di controllare, modellare e ancorare i risultati generati per allinearli ai loro obiettivi e garantire l'accuratezza.
La ricerca e il recupero basati sull'AI sono strumenti potenti che estraggono dati contestuali rilevanti da fonti specifiche, migliorando i modelli di AI per generare risposte affidabili e accurate o intraprendere azioni responsabili e sicure, come si vede nell'importante approccio Retrieval Augmented Generation (RAG). Al centro del recupero basato sull'AI ci sono la generazione di embedding e il reranking, due componenti chiave dell'AI che catturano il significato semantico dei dati e valutano la rilevanza delle query e dei risultati. Crediamo che l'integrazione della generazione di embedding e del reranking, così come la ricerca basata sull'AI, debbano essere parte del layer del database, semplificando lo stack e creando una base più affidabile per le applicazioni AI. Introducendo maggiore intelligenza nel database, aiutiamo le aziende a ridurre le allucinazioni, migliorare l'affidabilità e sfruttare appieno il potenziale dell'AI su larga scala.
Le applicazioni di maggior impatto richiedono una base dati flessibile, intelligente e scalabile. Ecco perché siamo entusiasti di annunciare l'acquisizione di Voyage AI, leader nei modelli di embedding e reranking che migliorano notevolmente la precisione attraverso la ricerca e il recupero basati sull'AI. Questa mossa non riguarda solo l'aggiunta di funzionalità di intelligenza artificiale, ma anche la ridefinizione del database per l'era dell'AI.
Perché questo è importante: il futuro dell'AI si basa su una maggiore pertinenza e accuratezza dei dati
L'AI è probabilistica: non viene sviluppata come i software tradizionali con regole e logiche predefinite. Al contrario, genera risposte o intraprende azioni in base a come il modello di AI è stato addestrato e ai dati recuperati. Tuttavia, a causa della natura probabilistica della tecnologia, l'AI può generare allucinazioni. Le allucinazioni sono una conseguenza diretta di un recupero scarso o impreciso: quando l'AI non ha accesso ai dati corretti, genera informazioni plausibili ma errate. Si tratta di un ostacolo importante all'adozione dell'AI, specialmente nelle aziende e per i casi d'uso mission-critical dove la precisione è imprescindibile.
Questo rende il recupero dei dati più rilevanti essenziale per le applicazioni AI, al fine di fornire risultati di alta qualità e contestualmente accurati. Oggi, gli sviluppatori si affidano a un mosaico di componenti separati per creare applicazioni basate sull'AI. Scelte non ottimali di questi componenti, come i modelli di embedding, possono portare a un recupero dei dati di bassa pertinenza e alla generazione di output di bassa qualità. Questo approccio frammentato è complesso, costoso, inefficiente e macchinoso per gli sviluppatori.
Con Voyage AI, MongoDB risolve questa sfida rendendo la ricerca e il recupero basati sull'intelligenza artificiale nativi al database. Invece di implementare soluzioni alternative o gestire sistemi separati, gli sviluppatori possono generare embedding di alta qualità dai dati operativi in tempo reale, memorizzare vettori, eseguire ricerche semantiche e perfezionare i risultati, tutto all'interno di MongoDB. Questo elimina la complessità e offre una maggiore precisione, una minore Latency e un'esperienza semplificata per gli sviluppatori.

In che modo Voyage AI migliora MongoDB
Voyage AI ha messo insieme un team di ricerca sull'AI di alto livello, con membri formatisi in istituti come Stanford, MIT, UC Berkeley e Princeton, ed è rapidamente diventato un leader nel recupero ad alta precisione basato sull'AI. La loro tecnologia è già stata scelta da alcune delle startup di AI più avanzate, tra cui Anthropic, LangChain, Harvey e Replit.
In particolare, i modelli di embedding di Voyage AI sono i modelli zero-shot più apprezzati nella comunità Hugging Face. I modelli di Voyage AI sono progettati per migliorare la qualità dell'output generato da:
-
Migliorare la ricerca vettoriale creando embedding che catturano meglio il significato attraverso testi, immagini, PDF e dati strutturati.
-
Migliorare l'accuratezza del recupero attraverso modelli avanzati di reranking che affinano i risultati di ricerca per applicazioni basate sull'AI.
-
Abilitare l'AI specifica per il dominio con modelli perfezionati e ottimizzati per diversi settori, come financial services, sanità e diritto, e per casi d'uso come la generazione di codice.
Integrando le capacità di recupero di Voyage AI in MongoDB, stiamo aiutando le organizzazioni a sviluppare applicazioni di AI con maggiore precisione e affidabilità, senza inutili complessità.
In che modo Voyage AI sarà integrato in MongoDB
Stiamo integrando Voyage AI con MongoDB in tre fasi. Nella prima fase, i modelli di embedding testuale, embedding multimodale e reranking di Voyage AI rimarranno ampiamente disponibili tramite le attuali API di Voyage AI e tramite i marketplace di AWS e Azure, garantendo agli sviluppatori di continuare a utilizzare le loro migliori funzionalità di embedding e reranking. Investiremo anche nella scalabilità e nella prontezza aziendale della piattaforma per supportare l'aumento dell'adozione dei modelli di Voyage AI.
Successivamente, integreremo in maniera fluida le capacità di Voyage AI in MongoDB Atlas, iniziando con un servizio di embedding automatico per Vector Search, che gestirà automaticamente la generazione di embedding. Seguirà il reranking nativo, consentendo agli sviluppatori di migliorare immediatamente l'accuratezza del recupero. Abbiamo anche intenzione di espandere le funzionalità di AI specifiche del dominio per supportare meglio diversi settori (ad esempio, financial services, settore giuridico, ecc.) o casi d'uso (ad esempio, generazione di codice).
Infine, ottimizzeremo il recupero basato sull'AI con capacità multimodali migliorate, consentendo un recupero e una classificazione perfetti di testo, immagini e video. Abbiamo anche in programma di introdurre modelli ottimizzati tramite istruzioni, che consentano agli sviluppatori di perfezionare il comportamento di ricerca utilizzando semplici prompt anziché complessi lavori di ottimizzazione. Questo processo sarà completato dall'integrazione della gestione del ciclo di vita in MongoDB Atlas, garantendo aggiornamenti continui e ottimizzazione in tempo reale per le applicazioni AI.
Cosa significa questo per gli sviluppatori e le imprese
Le applicazioni basate sull'AI necessitano di più di un database che si limiti a memorizzare, elaborare e conservare i dati: hanno bisogno di un database che migliori attivamente la precisione del recupero, che scali senza difficoltà e che elimini gli attriti operativi. Con Voyage AI, MongoDB ridefinisce i requisiti dei database per supportare applicazioni mission-critical basate sull'AI.
Gli sviluppatori non avranno più bisogno di gestire API di embedding esterne, archivi vettoriali autonomi o pipeline di ricerca complesse. Il recupero basato sull'AI sarà integrato nel database stesso, rendendo la ricerca semantica, il recupero vettoriale e il posizionamento fluidi come le query tradizionali.
Per le aziende, ciò si traduce in un tempo di realizzazione più veloce e in una maggiore fiducia nella scalabilità delle applicazioni AI. Fornendo risultati di alta qualità su larga scala, le aziende possono integrare senza problemi l'AI nei loro casi d'uso più critici, garantendo affidabilità, prestazioni e impatto nel mondo reale.
Uno sguardo al futuro: cosa succederà dopo
Questo è solo l'inizio. La nostra visione è fare di MongoDB il database più potente e intuitivo per le applicazioni moderne basate sull'AI.
-
I modelli di Voyage AI saranno presto disponibili nativamente in MongoDB Atlas.
-
Continueremo a sviluppare le funzionalità di recupero basate sull'AI di MongoDB, rendendole più intelligenti, adattabili e in grado di gestire una gamma più ampia di tipi di dati e casi d'uso.
Seguici per ulteriori dettagli su come puoi iniziare a utilizzare le funzionalità di Voyage AI in MongoDB.
Per saperne di più su come MongoDB e Voyage AI stanno potenziando la ricerca e il recupero basati sull'AI per la creazione, la scalabilità e l'implementazione di applicazioni intelligenti, visita la nostra pagina del prodotto.