혁신적 성장을 지원하는 MongoDB Atlas와 LLM

David Macias

생성형 AI 기반 애플리케이션에서 고객을 위한 매력적이고 차별화된 경험을 구축하려면 인공 지능의 기반을 진실에 둬야 합니다. 이러한 진실은 데이터, 더 구체적으로 말하면 가장 최신 버전의 운영 데이터에서 비롯됩니다. 고급 시맨틱 검색을 통해 초개인화된 경험을 제공할 때든, 사용자 콘텐츠와 대화를 생성할 때든, MongoDB Atlas는 운영, 분석, 벡터 검색 데이터 서비스를 통합해 LLM과 트랜스포머 모델의 강력한 기능을 앱에 삽입하는 작업을 간소화해줍니다.

개발자들은 매일 획기적이고 혁신적인 차세대 생성형 AI 기반 애플리케이션을 구축합니다. 상업적인 오픈 소스 LLM은 엄청난 속도로 발전하고 있습니다. 이를 기반으로 구축할 수 있는 프레임워크와 도구는 매우 다양하고, 이러한 프레임워크와 도구는 혁신을 민주화합니다. 하지만 개발팀이 반드시 메워야 할 간극이 있습니다. 바로 이러한 애플리케이션을 프로토타입에서 엔터프라이즈급 애플리케이션으로 발전시키는 것입니다. 먼저, 이러한 거대 모델이 액세스할 수 있는 데이터는 최신 정보가 아닙니다. 따라서 모델이 부정확하거나 정보에 기반하지 않은 답변을 제공할 수 있습니다. 답변이 정보에 기반하지 않는 문제를 해결할 수 있는 옵션에는 두 가지가 있습니다. 하나는 거대 모델을 세세하게 조정하는 것이고, 다른 하나는 거대 모델에 장기 메모리를 제공하는 것입니다. 하지만 이러한 옵션을 사용할 경우 두 번째 장벽이 생깁니다. 바로 적절한 보안 제어 기능을 탑재하고 있고 사용자가 기대하는 규모와 성능으로 정보를 학습시킨 LLM을 기반으로 애플리케이션을 배포해야 한다는 것입니다.

경직된 스키마의 방해 없이 거대 모델 학습에 필요한 끊임없이 변화하는 비정형 데이터와 정형 데이터에 적응하려면 개발자에게 데이터 모델 유연성을 갖춘 데이터 플랫폼이 필요합니다. 비록 모델을 세세하게 조정하는 것은 선택 사항이지만, 이 작업은 시간과 컴퓨팅 리소스 측면에서 엄청난 비용을 초래합니다. 즉, 개발자는 거대 모델에 프롬프트의 일부로 문맥을 제공하는 데이터를 제시할 수 있어야 하고, 생성형 모델에 장기 메모리를 제공해야 합니다. 아래에서 다양한 LLM과 생성형 AI 프레임워크를 사용해 이를 가능하게 하는 방법을 살펴보도록 하겠습니다.

MongoDB로 AI 기반 앱을 구축하는 방법은 AI 자료 페이지에서 더 자세히 확인할 수 있습니다.

MongoDB Atlas와 거대 언어 모델 입문을 위한 5가지 자료

MongoDB Atlas를 사용하면 하이퍼스케일러, 오픈 소스 LLM, 프레임워크 같은 선도적인 생성형 AI 서비스와 시스템을 원활하게 통합할 수 있습니다. 개발자는 Atlas DatabaseAtlas Vector Search(프리뷰)를 통해 문서 저장소와 벡터 임베딩 데이터 저장소를 한 곳에 결합해 운영 데이터의 진실을 기반으로 하는 생성형 AI 기반 애플리케이션 구축을 가속화할 수 있습니다. 아래 예시에서 보편적으로 사용되는 LLM 프레임워크와 MongoDB를 사용해 이를 가능하게 하는 방법을 살펴보겠습니다.

1. Atlas Vector Search(프리뷰)와 시맨틱 검색용 OpenAI 시작하기

이 튜토리얼에는 MongoDB Atlas를 사용해 샘플 영화 데이터 세트에서 시맨틱 검색을 수행하는 단계가 설명되어 있습니다. 먼저, 새 문서가 클러스터에 삽입될 때마다 OpenAI API를 호출해 벡터 임베딩으로 변환하도록 Atlas 트리거를 설정합니다. 그다음, Atlas Vector Search를 사용해 벡터 검색 쿼리를 수행합니다. HuggingFace 모델을 활용하는 방법을 알려주는 특별 보너스 섹션도 마련되어 있습니다. 튜토리얼 살펴보기

2. Llamalndex와 MongoDB를 사용해 독점 데이터로 생성형 AI 기반 채팅 앱 구축하기

LlamaIndex는 LLM을 외부 데이터와 연결할 수 있는 간단하고 유연한 인터페이스를 제공합니다. LlamaIndex와 MongoDB가 함께 운영하는 이 블로그에서는 맞춤형 채팅 앱을 구축해야 하는 이유와 그 방법을 자세히 살펴볼 수 있습니다. 블로그에 첨부된 노트에는 영어 쿼리를 사용해 모든 PDF 문서를 조회하는 방법을 배울 수 있는 코드가 설명되어 있습니다. 블로그 보기

3. Atlas Vector Search(프리뷰)를 LangChain의 벡터 저장소로 사용하는 방법에 관한 문서

파트너십 발표에 관한 블로그 게시물에서 언급한 것처럼 LangChain과 MongoDB Atlas는 서로 잘 어울리는 조합입니다. 커뮤니티에서 유기적으로 발생한 열정이 LangChain에서 여러 가지 MongoDB 통합을 지원하는 것으로 이어졌다는 사실이 이를 증명합니다. MongoDB를 채팅 로그 기록으로 활용하도록 지원하는 기존 통합에 더불어 이제 Atlas Vector Search를 Vector Store로 활용하는 기능도 지원됩니다. 문서 읽기: python, javascript

4. MindsDB AI Collections를 사용해 MongoDB Atlas에서 바로 예측 생성하기

MindsDB는 자동화된 머신 러닝을 데이터베이스에 제공하는 오픈 소스 머신 러닝 플랫폼입니다. 이 블로그에서는 MindsDB AI Collections를 사용해 Atlas에서 바로 예측을 생성하며 예측을 일반 데이터처럼 사용하고, 이러한 예측을 조회하며, 배포 워크플로를 간소화해 개발 속도를 가속화하는 역량을 키울 수 있습니다. 블로그 보기

5. Atlas 트리거를 사용해 HuggingFace 트랜스포머 모델을 MongoDB Atlas에 통합하기

HuggingFace는 머신 러닝 모델을 간편하게 구축하고, 학습시키고, 배포할 수 있는 AI 커뮤니티입니다. HuggingFace와 Atlas 트리거를 함께 사용하면 모델에 장기 메모리를 제공하는 운영 데이터의 변경 사항에도 쉽게 대응할 수 있습니다. MongoDB 데이터베이스에 저장된 새 문서의 분위기를 자동으로 예측하고 문서에 추가 필드로 추가하도록 트리거를 설정하는 방법을 살펴보세요. GitHub 리포지토리 보기

그림 1: 외부 데이터 또는 독점 데이터로 LLM에 장기 메모리를 제공하는 방법과 사용자가 입력한 질문에서부터 LLM 기반 응답까지의 데이터 흐름을 보여주는 샘플 앱 아키텍처

생성형 AI 기반 앱의 프로토타입에서부터 프로덕션까지, MongoDB와 함께

Atlas를 기반으로 구축된 MongoDB의 개발자 데이터 플랫폼은 현대적이고 최적화된 개발자 경험을 제공하는 동시에 전 세계 수천 개의 엔터프라이즈에서 확장 가능한 안전한 성능을 발휘할 수 있도록 철저한 테스트를 거쳤습니다.

Atlas는 스타트업에서부터 대기업까지 차세대 혁신을 구축 중인 기업에 다음과 같은 이점을 제공합니다.

  • 실제 운영 데이터를 기반으로 하는 생성형 AI 기반 애플리케이션을 빠르게 구축할 수 있습니다.

  • 앱과 벡터 데이터를 한 공간에 저장하고, 서버리스 함수를 사용해 소스 데이터의 변경 사항에 대응하고, 모든 데이터 형식에서 검색을 실행해 앱이 생성하는 응답의 관련성과 정확성을 개선하도록 지원하는 단일 플랫폼을 활용해 앱 아키텍처를 간소화할 수 있습니다.

  • 문서 모델의 유연성을 활용해 차세대 생성형 AI 기반 앱을 간편하게 개발하는 동시에 단순하고 세련된 개발자 경험을 유지할 수 있습니다.

  • 하이퍼스케일러, 오픈 소스 LLM, 프레임워크 등의 선도적인 AI 서비스와 시스템을 원활하게 통합해 역동적인 시장에서 경쟁력을 유지할 수 있습니다.

  • 지난 10년간 다양한 AI 사용 사례를 통해 검증된 확장성이 뛰어난 고성능 운영 데이터베이스에서 생성형 AI 기반 애플리케이션을 구축할 수 있습니다.

이러한 예시는 더 혁신적인 앱을 개발하는 데 필요한 요소로, MongoDB는 콘셉트 구상에서 프로덕션, 확장에 이르기까지 모든 단계를 지원합니다. 지금 바로 MongoDB Atlas 무료 티어에 가입해 원하는 프레임워크와 LLM을 통합하세요. MongoDB와 더 긴밀하게 협력하고 싶다면 인공지능 혁신을 지원하고 스타트업, 고객, 파트너의 최첨단 솔루션을 소개하는 MongoDB AI 이노베이터 프로그램을 살펴보세요.