Passez de 0 à 1 à l'état de préparation de l'entreprise avec MongoDB Atlas et les grands modèles de langage (LLM)

David Macias

Pour créer des expériences convaincantes et véritablement différenciées pour vos clients à partir d'applications génératives enrichies par l'IA, vous devez ancrer l'intelligence artificielle sur la vérité. Cette vérité provient de vos données, plus précisément, de vos données opérationnelles les plus récentes. Que vous fournissiez des expériences hyper-personnalisées avec une recherche sémantique avancée ou que vous produisiez du contenu et des conversations guidés par l'utilisateur, MongoDB Atlas unifie les services de données opérationnels, analytiques et de recherche vectorielle pour rationaliser l'intégration de la puissance des LLM et des modèles de transformateurs dans vos applications.

Chaque jour, des développeurs créent la prochaine application révolutionnaire basée sur l’IA générative. Les LLM commerciaux et open source évoluent très rapidement. Les frameworks et les outils qui permettent de les développer sont nombreux et démocratisent l'innovation. Pourtant, faire passer ces applications du stade de prototype à celui de solution d'entreprise représente un défi pour les équipes de développement. Pour commencer, ces modèles volumineux peuvent fournir des réponses erronées ou non pertinentes, car les données auxquelles ils ont accès sont obsolètes. Deux options s'offrent à vous pour résoudre ce dernier problème : affiner un grand modèle ou le doter d'une mémoire à long terme. Cependant, cette solution entraîne une deuxième difficulté : le déploiement d'une application sur un LLM pertinent avec les contrôles de sécurité adéquats, l'évolutivité et les performances attendues par les utilisateurs.

Les développeurs ont besoin d'une plateforme de données qui offre la flexibilité nécessaire pour s'adapter à l'évolution constante des données structurées et non structurées qui alimentent les grands modèles sans être entravés par des schémas rigides. Bien qu'il soit possible d'affiner un modèle, cela représente un coût prohibitif en termes de temps et de ressources informatiques. Cela signifie que les développeurs doivent être en mesure de présenter des données sous forme de contexte pour les grands modèles dans le cadre d'invites. Ils doivent doter des modèles génératifs d'une mémoire à long terme. Voici quelques exemples de la manière de procéder avec divers LLM et frameworks d'IA générative.

Consultez notre page de ressources sur l'IA pour en savoir plus sur la création d'applications alimentées par l'IA avec MongoDB.

Cinq ressources pour démarrer avec MongoDB Atlas et les grands modèles de langage

MongoDB Atlas facilite l'intégration des principaux services et systèmes d’IA générative tels que les hyperscalers et les LLM et frameworks open source. En combinant les dépôts de données des vector embeddings et des documents et en un seul endroit via Atlas Database et Atlas Vector Search (aperçu), les développeurs peuvent accélérer la création de leurs applications génératives enrichies par l’IA fondées sur la vérité des données opérationnelles. Voici quelques exemples d'utilisation avec les frameworks LLM les plus populaires et MongoDB :

1. Démarrer avec Atlas Vector Search (aperçu) et OpenAI pour la recherche sémantique

Ce tutoriel vous guide tout au long des étapes d’exécution d’une recherche sémantique sur un échantillon de données de films avec MongoDB Atlas. Vous commencerez par configurer un déclencheur Atlas pour appeler une API OpenAI chaque fois qu’un nouveau document est inséré dans votre cluster, afin de le convertir en vector embedding. Vous allez ensuite effectuer une requête de recherche vectorielle à l'aide d'Atlas Vector Search. Il y a même une section bonus qui vous explique comment exploiter les modèles HuggingFace. Regarder le tutoriel

2. Créer une application de chat enrichie par l'IA générative avec vos données propriétaires en utilisant Llamalndex et MongoDB

LlamaIndex fournit une interface simple et flexible pour connecter les LLM avec des données externes. Cet article rédigé conjointement par LlamaIndex et MongoDB explique plus en détail pourquoi et comment vous pourriez vouloir créer votre propre application de chat. Le carnet de notes annexé fournit une description de code permettant d'interroger n'importe quel document PDF à l'aide de requêtes en anglais. Lire l'article

3. Consulter la documentation sur l'utilisation d'Atlas Vector Search (aperçu) en tant que vector store avec LangChain

Comme indiqué dans le billet de blog annonçant le partenariat, LangChain et MongoDB Atlas s'accordent parfaitement, comme en témoigne l'enthousiasme de la communauté qui a conduit à plusieurs intégrations dans LangChain pour MongoDB. Outre la prise en charge d'Atlas Vector Search en tant que vector store, MongoDB prend déjà en charge l'historique des journaux de chat. Consulter les documents : python, javascript

4. Générer des prédictions directement dans MongoDB Atlas avec les collections d'IA MindsDB

MindsDB est une plateforme open source qui intègre le machine learning à la base de données. Cet article explique comment générer des prédictions directement dans Atlas avec les collections d'IA MindsDB. Vous pouvez ainsi utiliser ces prédictions comme des données régulières, les interroger et accélérer le développement en simplifiant les flux de travail de déploiement. Lire l'article

5. Intégrer les modèles de transformateurs HuggingFace dans MongoDB Atlas avec Atlas Triggers

HuggingFace est une communauté d’IA qui facilite la création, l’entraînement et le déploiement de modèles de machine learning. L’utilisation d’Atlas Triggers et de HuggingFace vous permet de réagir facilement aux changements dans les données opérationnelles qui fournissent une mémoire à long terme à vos modèles. Découvrez comment configurer des déclencheurs pour prédire automatiquement le sentiment des nouveaux documents dans votre base de données MongoDB et les ajouter en tant que champs supplémentaires à vos documents. Consulter le référentiel GitHub

Schéma n° 1 : l'exemple d'architecture d'application montre comment des données externes ou propriétaires fournissent une mémoire à long terme à un LLM et comment elles circulent de l'entrée d'un utilisateur à une réponse alimentée par le LLM.

Du prototype à la production avec MongoDB pour des applications génératives enrichies par l'IA

La developer data platform MongoDB basée sur Atlas offre une expérience de développement moderne et optimisée. Elle est testée par des milliers d'entreprises dans le monde entier pour assurer son évolutivité et sa sécurité.

Que vous meniez un projet pour une start-up ou une entreprise, Atlas vous permet de faire ce qui suit :

  • Accélérer la création de vos applications génératives enrichies par l’IA et fondées sur la vérité des données opérationnelles.

  • Simplifier l'architecture de vos applications en tirant parti d'une plateforme unique qui leur permet de stocker les applications et les données vectorielles en un seul endroit, de réagir aux changements dans les données sources avec des fonctions serverless et de rechercher parmi plusieurs modalités de données pour améliorer la pertinence et la précision des réponses générées par leurs applications.

  • Faire évoluer facilement vos applications enrichies par l'IA grâce à la flexibilité du document model, tout en conservant une expérience de développement simple et élégante.

  • Intégrer facilement les principaux services et systèmes d'IA tels que les hyperscalers et les LLM et frameworks open source afin de rester compétitif sur des marchés en perpétuelle évolution.

  • Créer des applications génériques enrichies par l'IA sur une base de données opérationnelle hautement performante et évolutive, validée depuis une dizaine d'années pour de nombreux cas d'utilisation de l'IA.

Bien que ces exemples constituent les prémices de projets encore plus innovants, MongoDB peut vous aider à passer du concept à la production puis à l'échelle. Commencez dès aujourd'hui en vous inscrivant à la version gratuite de MongoDB Atlas et en l'intégrant à vos frameworks et LLM préférés. Si vous souhaitez approfondir votre collaboration avec nous, consultez notre programme MongoDB AI Innovators, qui encourage l'innovation dans le secteur de l'intelligence artificielle et présente des solutions de pointe proposées par des start-ups, des clients et des partenaires.