Redéfinir la base de données pour l’IA : Pourquoi MongoDB a fait l'acquisition de Voyage AI

L’IA transforme les secteurs, redéfinit l’expérience client et modifie la manière dont les entreprises innovent, fonctionnent et gèrent la concurrence. Si les modèles d’avant-garde concentrent l’essentiel de l’attention, les données n’en demeurent pas moins un enjeu fondamental : de part leur façon d'être stockées, récupérées et préparées à l'usage pour les applications d’IA. La démocratisation des logiciels basés sur l’IA dépend de la capacité à s’appuyer sur les bonnes abstractions. Pourtant, aujourd’hui, la création d’applications d’IA utiles et en temps réel n’est pas à la portée de toutes les organisations.

Le défi n’est pas seulement la complexité, mais aussi la confiance. Les modèles d’IA sont probabilistes, ce qui signifie que leurs résultats ne sont ni déterministes ni prévisibles. Le problème de l’hallucination dans les chatbots actuels le montre clairement et devient encore plus critique avec l’essor des agents, où les systèmes d'IA prennent des décisions autonomes. Les équipes de développement doivent pouvoir contrôler, modeler et rectifier les résultats générés afin de les aligner sur leurs objectifs et en garantir l’exactitude.

La recherche et la récupération basées sur l’IA sont des outils puissants qui permettent d’extraire des données contextuelles pertinentes à partir de sources spécifiques, augmentant les modèles d’IA pour générer des réponses fiables et précises ou prendre des mesures responsables et sûres, comme le montre l’approche de la génération augmentée par récupération (RAG). La récupération basée sur l’IA repose sur deux composants clés de l’IA, la génération d’embeddings et le reclassement, qui permettent de capturer la signification sémantique des données et d’évaluer la pertinence des requêtes et des résultats. Nous pensons que la génération d’embeddings et le reclassement, de même que la recherche basée sur l’IA, doivent se situer au niveau de la couche de base de données de façon à simplifier la pile et à créer une base plus fiable pour les applications d’IA. En intégrant davantage d’intelligence dans la base de données, nous aidons les entreprises à réduire les hallucinations, à accroître la fiabilité et à exploiter pleinement le potentiel de l’IA à l’échelle.

Les applications les plus percutantes nécessitent un socle de données flexible, intelligent et évolutif. C’est pourquoi nous sommes ravis d’annoncer l’acquisition de Voyage AI, un leader des modèles d’embedding et de reclassement qui améliorent considérablement la précision grâce à la recherche et à la récupération basées sur l’IA. Cette action ne consiste pas seulement à ajouter des capacités d’IA, mais à redéfinir la base de données pour l’ère de l’IA.

Pourquoi est-ce important ? L’avenir de l’IA repose sur une meilleure pertinence et précision des données

L’IA est probabiliste : elle n’est pas construite comme un logiciel traditionnel avec des règles et une logique prédéfinies. Au lieu de cela, elle génère des réponses ou prend des mesures en fonction de la manière dont le modèle d’IA est entraîné et les données récupérées. Cependant, en raison de la nature probabiliste de la technologie, l’IA peut halluciner. Les hallucinations sont une conséquence directe d’une récupération de données mal conçue ou imprécise. Lorsque l’IA n’a pas accès aux données appropriées, elle génère des informations plausibles mais incorrectes. Il s’agit d’un obstacle majeur à l’adoption de l’IA, notamment dans les entreprises et pour les cas d’utilisation critiques où la précision est un impératif.

Par conséquent, pour que les applications d’IA fournissent des résultats de haute qualité et contextuellement précis, il est essentiel de récupérer les données les plus pertinentes. Aujourd’hui, les développeurs s’appuient sur un ensemble de composants distincts pour créer des applications basées sur l’IA. Un choix sous-optimal de ces composants, tels que les modèles d’embedding, peut entraîner une récupération de données peu pertinente et des résultats générés de faible qualité. Cette approche fragmentée est complexe, coûteuse, inefficace et fastidieuse pour les développeurs.

Avec Voyage AI, MongoDB résout ce défi en intégrant de façon native la recherche et la récupération assistées par l’IA à la base de données. Au lieu d’implémenter des solutions de contournement ou de gérer des systèmes distincts, les développeurs peuvent générer des embeddings de haute qualité à partir de données opérationnelles en temps réel, stocker des vecteurs, effectuer une recherche sémantique et affiner les résultats, le tout dans MongoDB. Cette approche élimine la complexité, augmente la précision, réduit la latence et offre une expérience de développement simplifiée.

Création d’applications basées sur l’IA avant et après MongoDB et Voyage AI

Ce que Voyage AI apporte à MongoDB

Voyage AI a constitué une équipe de recherche en IA de renommée mondiale rassemblant des universitaires de Stanford, du MIT, de l’UC Berkeley et de Princeton. L’entreprise est rapidement devenue un leader de la récupération de haute précision assistée par l’IA. Sa technologie est déjà adoptée par certaines des startups les plus avancées en IA, notamment Anthropic, LangChain, Harvey et Replit.

En particulier, les modèles d’embedding de Voyage AI sont les modèles zero-shot les mieux notés de la communauté Hugging Face. Les modèles de Voyage AI sont conçus pour améliorer la qualité des résultats générés par :

  • Amélioration de la recherche vectorielle en créant des embeddings qui capturent mieux le sens du texte, des images, des PDF et des données structurées.

  • Amélioration de la précision de la récupération grâce à des modèles de reclassement avancés qui affinent les résultats de recherche pour les applications alimentées par l’IA.

  • IA spécifique au domaine avec des modèles ajustés et optimisés pour divers secteurs comme les services financiers, la santé et le droit, ainsi que pour des cas d’utilisation comme la génération de code.

En intégrant les capacités de récupération de Voyage AI dans MongoDB, nous aidons les organisations à créer plus facilement des applications d’IA avec une plus grande précision et fiabilité, sans complexité superflue.

Comment Voyage AI sera intégré dans MongoDB

L’intégration de Voyage AI dans MongoDB se déroulera en trois phases. Dans la première phase, les modèles d’embedding de texte, d’embedding multimodal et de reclassement de Voyage AI resteront largement disponibles via les API actuelles de Voyage AI et les places de marché AWS et Azure, garantissant ainsi aux développeurs de pouvoir continuer à utiliser leurs fonctionnalités d’embedding et de reclassement de qualité. Nous investirons également dans l’évolutivité et la préparation de la plateforme à l’entreprise afin de soutenir l’adoption des modèles de Voyage AI.

Ensuite, nous intégrerons de manière fluide les fonctionnalités de Voyage AI dans MongoDB Atlas, en commençant par un service d’embedding automatisé pour Vector Search, qui assurera la génération automatique d’embeddings. Des fonctions natives de reclassement suivront, permettant aux développeurs d’améliorer instantanément la précision de la récupération. Nous prévoyons également d’étendre les capacités d’IA spécifiques à un domaine pour mieux soutenir divers secteurs (services financiers, juridiques, etc.) ou cas d’utilisation (p. ex., génération de code).

Enfin, nous allons faire progresser la récupération assistée par l’IA avec des capacités multimodales améliorées, permettant une récupération et un classement fluides de textes, d’images et de vidéos. Nous prévoyons également d’introduire des modèles réglés par instructions, permettant aux développeurs d’affiner le comportement de recherche à l’aide de prompts simples au lieu d’un réglage complexe. Cela sera complété par l’intégration de la gestion du cycle de vie dans MongoDB Atlas, assurant des mises à jour continues et une optimisation en temps réel pour les applications d’IA.

Implications pour les développeurs et les entreprises

Les applications alimentées par l’IA nécessitent plus qu’une simple base de données qui stocke, traite et conserve les données ; elles ont besoin d’une base de données qui améliore activement la précision de la récupération, assure une répartition transparente et élimine les frictions opérationnelles. Avec Voyage AI, MongoDB redéfinit ce qui est nécessaire pour qu’une base de données soutienne des applications critiques alimentées par l’IA.

Les développeurs n’auront plus besoin de gérer des API d’embedding externes, des magasins de vecteurs autonomes ou des pipelines de recherche complexes. La récupération par IA sera intégrée directement dans la base de données, rendant la recherche sémantique, la récupération vectorielle et le classement aussi fluides que les requêtes traditionnelles.

Pour les entreprises, cela signifie un délai de rentabilisation plus rapide et une plus grande confiance dans la mise à l’échelle des applications d’IA. En fournissant des résultats de haute qualité à l’échelle, les entreprises peuvent intégrer l’IA de manière transparente dans leurs cas d’utilisation les plus critiques, garantissant ainsi la fiabilité, la performance et un impact sur le monde réel.

Ce que nous prévoyons ensuite

Ce n’est que le début. Notre vision est de faire de MongoDB la base de données la plus puissante et intuitive pour les applications modernes alimentées par l’IA.

  • Les modèles de Voyage AI seront bientôt disponibles de façon native dans MongoDB Atlas.

  • Nous continuerons à faire évoluer les capacités d’extraction d’IA de MongoDB, en les rendant plus intelligentes, plus adaptables et capables de gérer un plus large éventail de types de données et de cas d’utilisation.

Restez à l’écoute pour plus de détails sur la façon dont vous pouvez commencer à utiliser les capacités de Voyage AI dans MongoDB.

Pour en savoir plus sur la manière dont MongoDB et Voyage AI optimisent les fonctionnalités de recherche et de récupération basées sur l’IA pour créer, mettre à l’échelle et déployer des applications intelligentes, consultez notre page produit.