Présentation d'Atlas Stream Processing - Simplifier le chemin vers des applications réactives et event-driven

MongoDB
September 14, 2023 | Updated: September 15, 2023

Aujourd'hui, nous sommes heureux d'annoncer l'avant-première privée (Private Preview) d'Atlas Stream Processing !

Le monde évolue de plus en plus vite et vos applications doivent pouvoir tenir le rythme. Les applications réactives et event-driven donnent vie à des expériences numériques pour vos clients et accélèrent le temps de compréhension et d'action pour l'entreprise. Pensez à :

avertir vos utilisateurs dès que l'état de leur livraison change,
bloquer les transactions frauduleuses lors du traitement des paiements
analyser la télémétrie des capteurs au fur et à mesure qu'elle est générée afin de détecter les défaillances potentielles de l'équipement et d'y remédier avant les pannes coûteuses.

Dans chacun de ces exemples, les données perdent de leur valeur au fil des secondes. Elles doivent être requêtées et faire face à une action en continu et ce avec une faible latence. Pour ce faire, les développeurs se tournent de plus en plus vers des applications event-driven alimentées par des données en continu, de manière à ce qu'elles puissent instantanément réagir et répondre à l'évolution constante du monde qui les entoure. Atlas Stream Processing aidera les développeurs à passer plus rapidement à des applications event-driven.

Au fil des ans, les développeurs ont adopté la base de données MongoDB parce qu'ils apprécient la flexibilité et la facilité d'utilisation de document model, ainsi que l'API de requête MongoDB qui leur permet de travailler avec des données en tant que code. Ces principes fondamentaux éliminent radicalement les frictions liées au développement de logiciels et d'applications. Aujourd'hui, nous appliquons ces mêmes principes aux données en continu. Atlas Stream Processing redéfinit l'expérience des développeurs qui travaillent avec des streams complexes de données à haute vitesse et à évolution rapide, et unifie la façon dont les développeurs travaillent avec des données en mouvement et au repos.

Bien que les produits et technologies existants aient apporté de nombreuses innovations en matière de flux et de traitement des flux, nous pensons que MongoDB est naturellement bien adapté pour aider les développeurs à relever certains défis clés restants. Ces défis comprennent la difficulté de travailler avec des données variables, à fort volume et à grande vitesse, les frais généraux contextuels liés à l'apprentissage de nouveaux outils, langages et API, ainsi que la maintenance opérationnelle supplémentaire et la fragmentation qui peuvent être introduites par des technologies ponctuelles dans des piles d'applications complexes.

Présentation de l'Atlas Stream Processing

Atlas Stream Processing permet de traiter des flux de données complexes à grande vitesse avec quelques avantages uniques pour le développeur :

Atlas Stream Processing est basé sur le modèle documentaire, ce qui lui confère une grande souplesse dans le traitement des structures de données imbriquées et complexes qui sont courantes dans les streams d'événements. Cela évite les étapes de prétraitement et permet aux développeurs de travailler de façon intuitive et facile avec des données aux structures complexes. Tout comme la base de données le permet.
Cela unifie l'expérience de travail à travers tout type de données, en offrant une plateforme unique - à travers l'API, le langage de requête et les outils - pour traiter des données de streams riches et complexes, parallèlement aux données d'application critiques de votre base de données.
Atlas Stream Processing est entièrement managé dans MongoDB Atlas, en s'appuyant sur un définisseur de services intégrés déjà robuste. Quelques appels d'API et quelques lignes de code suffisent pour mettre en place un processeur de flux, une base de données et une couche de service d'API sur l'ensemble des principaux fournisseurs cloud.
Atlas Stream Processing est entièrement managé dans MongoDB Atlas, en s'appuyant sur un définisseur de services intégrés déjà robuste. Quelques appels d'API et quelques lignes de code suffisent pour mettre en place un processeur de flux, une base de données et une couche de service d'API sur l'ensemble des principaux fournisseurs cloud.

Comment fonctionne Atlas Stream Processing ?

Atlas Stream Processing se connecte à vos données critiques, qu'elles se trouvent dans MongoDB (via change stream) ou dans une plateforme de streaming comme Apache Kafka. Les développeurs peuvent se connecter facilement et de manière transparente à Confluent cloud, Amazon MSK, Redpanda, Azure Event Hubs, ou à l'auto-managé Kafka en utilisant le protocole Kafka wire. En s'intégrant au pilote Kafka natif, Atlas Stream Processing offre des performances natives à faible latence.

En plus de notre partenariat stratégique de longue date avec Confluent, nous sommes heureux d'annoncer les partenariats avec AWS, Microsoft, Redpanda et Google, dès le lancement.

Atlas Stream Processing fournit ensuite 3 fonctionnalités clés nécessaires pour transformer votre stream de données en une expérience client différenciée. Examinons-les un par un.

Traitement en continu

Tout d'abord, les développeurs peuvent désormais utiliser le modèle d'agrégation de MongoDB pour traiter en continu des flux de données riches et complexes provenant de plateformes de streaming d'événements telles qu'Apache Kafka. Cela ouvre de nouvelles voies puissantes pour le requêtage, l'analyse et l'accès aux données en continu sans aucun des retards inhérents au traitement par lots. Avec modèle d'agrégation, vous pouvez filtrer et grouper les données, agréger les streams d'événements à grande vitesse en informations exploitables sur le temps d'état Windows, ce qui permet d'enrichir les expériences d'application en temps réel.

Validation continue

Ensuite, Atlas Stream Processing offre aux développeurs des mécanismes robustes et natifs pour traiter les problèmes de données incorrectes qui peuvent autrement causer des ravages dans les applications. Les potentiels problèmes comprennent la transmission de résultats inexacts à l'application, la perte de données et les temps d'arrêt de l'application. Atlas Stream Processing résout ces problèmes afin de garantir le traitement et le partage des données en continu de manière fiable entre les applications event-driven.

Atlas Stream Processing :

Apporte une validation en continue du schéma afin de vérifier que les événements sont correctement formés avant d'être traités, par exemple en rejetant les événements dont les champs sont manquants ou qui contiennent des plages de valeurs non valides.
Détecte l'altération des messages
Détecte les données arrivées tardivement qui ont manqué une fenêtre de traitement.

Les pipelines d'Atlas Stream Processing peuvent être configurées avec une Dead Letter Queue (DLQ) dans laquelle les événements qui échouent à la validation sont acheminés. Cela évite aux développeurs d'avoir à construire et à maintenir leurs propres implémentations personnalisées. Les problèmes peuvent être rapidement résolus et le risque que des données manquantes ou corrompues entraînent l'arrêt de l'ensemble de l'application est minimisé.

Fusion continue

Les données traitées peuvent ensuite être matérialisées en continu dans des vues gérées dans des collections de bases de données Atlas. On peut considérer qu'il s'agit d'une requête "push". Les applications peuvent extraire les résultats (via des requêtes) de la vue en utilisant l'API de requête MongoDB ou l'interface Atlas SQL. La fusion continue des mises à jour des collections est un moyen très efficace de maintenir des vues analytiques fraîches des données pour soutenir la prise de décision et l'action humaine et automatisée. Outre les vues matérialisées, les développeurs ont également la possibilité de publier les événements traités dans des systèmes de diffusion en continu tels qu'Apache Kafka.

Création d'un Stream Processor

Nous allons vous montrer à quel point il est facile de construire un processeur de flux dans MongoDB Atlas. Avec Atlas Stream Processing, vous pouvez utiliser la même syntaxe de pipeline d'aggrégation pour un stream processor que celle que vous connaissez pour la base de données. Nous présentons ci-dessous une instance de traitement de stream simple, du début à la fin. Il suffit de quelques lignes de code.

Tout d'abord, nous allons écrire une pipeline d'agrégation qui définit une source pour vos données, effectue une validation pour s'assurer que les données ne proviennent pas de l'adresse IP localhost/127.0.0.1, crée une fenêtre de basculement pour collecter des données de messages groupés toutes les minutes, puis fusionne ces données nouvellement traitées dans une collection MongoDB dans Atlas.

Ensuite, nous allons créer notre Stream Processor appelé "netattacks" en spécifiant notre pipeline nouvellement définie p ainsi que dlq comme arguments. Ceci lancera le traitement souhaité et, grâce au Dead Letter Queue (DLQ), stocke en toute sécurité les données non valides en vue d'une inspection, d'un débogage ou d'un nouveau traitement ultérieur.

Enfin, nous pouvons le démarrer. C'est tout ce qu'il faut pour construire un stream processor dans MongoDB Atlas.

Demander un aperçu privé

Nous sommes impatients de mettre ce produit entre vos mains et de voir ce que vous en ferez. Pour en savoir plus sur Atlas Stream Processing et demander un accès anticipé ici pour participer à l'aperçu privé une fois qu'il sera ouvert aux développeurs.

Nouveau sur MongoDB ? Commencez gratuitement dès aujourd'hui en créant votre compte MongoDB Atlas.

Sphère de sécurité

Le développement, la publication et le calendrier des caractéristiques ou fonctionnalités décrites pour nos produits demeurent à notre entière discrétion. Cette information est simplement destinée à décrire l'orientation générale des produits et ne doit pas être invoquée pour prendre une décision d'achat, et n'est pas un engagement, une promesse ou une obligation légale de fournir un matériel, un code ou une fonctionnalité.

← Previous

Einführung von Atlas Vector Search: Entwickeln Sie intelligente Anwendungen mit Semantic Search und KI für alle Arten von Daten

Wir freuen uns, Ihnen mitteilen zu können, dass Atlas Vector Search jetzt allgemein verfügbar ist. Vector Search unterstützt jetzt Produktions-Workloads, sodass Sie auch weiterhin intelligente Anwendungen auf Basis von Semantic Search und generativer KI erstellen können, während der Ressourcenverbrauch optimiert und die Leistung mit Search Nodes verbessert wird. Die vollständige Ankündigung und die Liste der Vorteile finden Sie unten. Die Zeit ist endlich gekommen. Künstliche Intelligenz hat sich nach links verschoben. Was einst in unternehmensweiten Data-Science- und Machine-Learning-Teams entwickelt wurde und oft dort feststeckte, ist jetzt für Entwickler auf der ganzen Welt leicht verfügbar. Um jedoch die unglaubliche Leistungsfähigkeit dieser neuen Tools nutzen zu können, müssen sie auf einer zuverlässigen, zusammensetzbaren und eleganten Datenplattform aufbauen. Gleichzeitig sind diese neuen Funktionen, wie wir alle gesehen haben, nur so gut, wie die Daten oder die „Grundwahrheit“, auf die sie zugreifen müssen. Aus diesem Grund freuen wir uns, der MongoDB Atlas Developer Data Platform eine weitere Funktion hinzuzufügen, um das volle Potenzial Ihrer Daten auszuschöpfen und KI-Anwendungen voranzutreiben. MongoDB freut sich, heute unsere aufregende neue Vector Search Funktion bekannt zu geben, die den Anforderungen von Daten in allen Formen gerecht wird und es unseren Partnern ermöglicht, diese unglaublichen neuen Funktionen zu nutzen. Auf unserer KI-Ressourcenseite erfahren Sie mehr über die Entwicklung von KI-gestützten Apps mit MongoDB. Was ist die Fähigkeit? Für diejenigen unter Ihnen, die es nicht kennen: Vector Search ist eine Funktion, mit der Sie Ihre Daten auf der Grundlage der Semantik oder der Bedeutung der Daten und nicht auf der Grundlage der Daten selbst abfragen können. Möglich wird dies dadurch, dass man jede Form von Daten numerisch als Vektor darstellen kann, die dann mit Hilfe hochentwickelter Algorithmen miteinander verglichen werden können. Der erste Schritt besteht darin, die Quelldaten, egal ob Text, Audio, Bild oder Video, mithilfe eines „Kodierungsmodells“ in „Vektoren“ oder „Einbettungen“ umzuwandeln. Dank der jüngsten Fortschritte in der künstlichen Intelligenz sind diese Vektoren nun besser in der Lage, die Bedeutung von Daten zu erfassen, indem sie niedrigerdimensionale Daten in einen höherdimensionalen Raum projizieren, der mehr Kontext zu den Daten enthält. Sobald diese Daten in diese numerischen Darstellungen umgewandelt wurden, können Sie Abfragen durchführen, um ähnliche Werte mithilfe eines ANN-Algorithmus (Approximate Nearest Neighbors) zu finden, der es Ihren Abfragen ermöglicht, sehr schnell Daten mit ähnlichen Vektoren zu finden. Auf diese Weise können Sie Anfragen wie „Gib mir Filme mit dem Gefühl der Traurigkeit“ oder „Gib mir Bilder, die aussehen wie ...“ erfüllen. Diese Fähigkeit eröffnet Ihnen eine ganz neue Gruppe von Möglichkeiten. In welcher Beziehung steht dies zu unserer Plattform? Da diese Funktionalität nativ in MongoDB Atlas integriert ist, müssen Sie Ihre Daten nicht kopieren und transformieren, keinen neuen Stack und keine neue Syntax erlernen oder eine völlig neue Infrastruktur managen. Mit Atlas Vector Search von MongoDB ist das alles nicht nötig. Sie können diese leistungsstarken neuen Funktionen innerhalb einer erstklassigen und kampferprobten Plattform nutzen, um Anwendungen schneller als je zuvor zu entwickeln. Viele der mit der Nutzung von KI und Vector Search verbundenen Herausforderungen ergeben sich aus der Komplexität, die mit der sicheren Offenlegung Ihrer Anwendungsdaten verbunden ist. Diese Aufgaben erhöhen die Reibungspunkte für die Entwicklererfahrung und erschweren das Entwickeln, Debuggen und Warten Ihrer Anwendungen. MongoDB beseitigt all diese Herausforderungen und bringt gleichzeitig die Leistungsfähigkeit von Vector Search auf eine Plattform, die organisch vertikal und horizontal skaliert, um jeden Workload zu bewältigen, die Sie ihr auferlegen. Schließlich ist nichts davon ohne Garantien in Bezug auf Sicherheit und Verfügbarkeit von Bedeutung, und das Engagement von MongoDB für eine sichere Datenverwaltungslösung zusammen mit hoher Verfügbarkeit durch Redundanz und automatischem Failover sorgt dafür, dass Ihre Anwendung nie aus dem Takt kommt. Neu bei MongoDB.local London Bei .Local London freuen wir uns, die Einführung einer speziellen Vektorsuch-Aggregationsstufe ankündigen zu können, die über $vectorSearch aufgerufen werden kann. Diese neue Aggregationsstufe führt ein paar neue Konzepte ein, die die Vektorsuche noch leistungsfähiger und einfacher als je zuvor machen. Mit $vectorSearch können Sie auch einen Vorfilter mit MQL-Syntax (z. B. $gte, $eq usw.) verwenden, die beim Durchlaufen des Index Dokumente herausfiltert, was zu konsistenten Ergebnissen und hoher Leistung führt. Jeder Entwickler, der MongoDB versteht, wird diese Filterfunktion problemlos nutzen können! Schließlich führen wir auch zwei Möglichkeiten ein, Ihre Ergebnisse innerhalb der Aggregationsphase zu optimieren, sowohl einen „numCandidates“ -Parameter als auch einen „limit“ -Parameter. Mit diesen Parametern können Sie einstellen, wie viele Dokumente für die ungefähre Suche nach dem nächsten Nachbarn in Frage kommen sollen, und dann die Anzahl der gewünschten Ergebnisse mit dem „Limit“ einschränken. Wie interagiert dies mit der Umgebung? Die Menge an Innovationen im Bereich der künstlichen Intelligenz ist erstaunlich und es ist beeindruckend zu sehen, welche rasanten Fortschritte die Open Source Community macht. Es gibt enorme Fortschritte bei Open-Source-Sprachmodellen sowie bei den verschiedenen Methoden, mit denen sie in Anwendungen integriert werden können. Angesichts der enormen Leistungsfähigkeit, die künstliche Intelligenz bietet, war es noch nie so wichtig, eine solide Abstraktion für diese Funktion zu haben, um Entwicklern die Flexibilität zu bieten, die sie benötigen. Vor diesem Hintergrund freuen wir uns, Ihnen mitteilen zu können, dass wir in LangChain und LlamaIndex mehrere Funktionen unterstützen, von der Unterstützung von Vector Search bis hin zur Chat-Protokollierung und Dokumentindizierung. Wir schreiten hier schnell voran und werden weiterhin neue Funktionen für die führenden Anbieter veröffentlichen. Zusammenfassung Trotz alledem geht es gerade erst los. Wir bei MongoDB setzen uns dafür ein, Entwicklern dabei zu helfen, die nächste Generation von KI-fähigen Anwendungen zu entwickeln – mit der besten Plattform für Entwicklerdaten auf dem Markt. Wir werden uns auch mit weiteren Frameworks und Plugin-Architekturen befassen, die wir unterstützen können. Aber wie immer sind Sie als Entwickler der wichtigste Teil dieser Gleichung. Wir werden mit der Community sprechen und Wege finden, wie wir Ihnen am besten helfen können, und sicherstellen, dass wir Ihre Bedürfnisse bei jedem Schritt erfüllen. Geh los und entwickel! Um mehr über Atlas Vector Search zu erfahren und herauszufinden, ob es die richtige Lösung für Sie ist, schauen Sie sich unsere Dokumentation , unser Whitepaper und unsere Tutorials an oder legen Sie noch heute los .

September 14, 2023

Next →

Customer Service Expert Wati.io Scales Up on MongoDB

Wati.io is a software-as-a-service (SaaS) platform that empowers businesses to develop conversation-driven strategies to boost growth. Founded by CEO Ken Yeung in 2019, Wati started as a chatbot solution for large enterprises, such as banks and insurance companies. However, over time, Yeung and his team noticed a growing need among small and medium-sized businesses (SMBs) to manage customer conversations more effectively. To address this need, Wati used MongoDB Atlas and built a solution based on the WhatsApp Business API. It enables businesses to manage and personalize conversations with customers, automate responses, improve commerce functions, and enhance customer engagement. Speaking at MongoDB.local Hong Kong in September 2024, Yeung said, “The current solutions on the market today are not good enough. Especially for SMBs [that] don’t have the same level of resources as enterprises to deal with the number of conversations and messages that need to be handled every day.” Supporting scale: From MongoDB Community Edition to MongoDB Atlas “From the beginning, we relied on MongoDB to handle high volumes of messaging data and enable businesses to manage and scale their customer interactions efficiently,” said Yeung. Wati originally used MongoDB Community Edition , as the company saw the benefits of a NoSQL model from the beginning. As the company grew, it realized it needed a scalable infrastructure, so Wati transitioned to MongoDB Atlas. “When we started reaching the 2 billion record threshold, we started having some issues. Our system slowed down, and we were not able to scale it,” said Yeung. Atlas has now become an essential part of Wati’s infrastructure, helping the company store and process millions of messages each month for over 10,000 customers in 165 countries. “Transitioning to a new platform—MongoDB Atlas—seamlessly was critical because our messaging system needs to be on 24/7,” said Yeung. Wati collaborated closely with the MongoDB Professional Services and MongoDB Support teams, and in a few months it was able to rearchitect the deployment and data model for future growth and demand. The work included optimizing Wati’s database by breaking it down into clusters. Wati then focused on extracting connections, such as conversations, and dividing and categorizing data within the clusters—for example, qualifying data as cold or hot based on the read and write frequencies. This architecture underpins the platform’s core features, including automated customer engagement, lead qualification, and sales management. Deepening search capabilities with MongoDB Atlas Search For Wati’s customers, the ability to search through conversation histories and company documents to retrieve valuable information is a key function. This often requires searching through millions of records to rapidly find answers so that they can respond to customers in real-time. By using MongoDB Atlas Search , Wati improved its search capabilities, ultimately helping its business customers perform more advanced analytics and improve their customer service agents’ efficiency and customer reporting. “[MongoDB] Atlas Search is really helpful because we don’t have to do a lot of technical integration, and minimal programming is required,” said Yeung. Looking ahead: Using AI and integrating more channels Wati expects to continue collaborating with MongoDB to add more features to its platform and keep innovating at speed. The company is currently exploring to build more AI capabilities of Wati KnowBot , as well as how it can expand its integration with other conversation platforms and channels such as Instagram and Facebook. To learn more about MongoDB Atlas, visit our product page . To get started with MongoDB Atlas Search, visit the Atlas Search product page .

November 25, 2024