Atlas Vector Search 소개: 모든 유형의 데이터에 대해 시맨틱 검색과 AI로 지능형 애플리케이션 구축하기

Benjamin Flast

Atlas Vector Search을 정식으로 출시하게 되어 기쁘게 생각합니다. 이제 Vector Search에서 프로덕션 워크로드가 지원되므로 시맨틱 검색과 생성형 AI 기반의 지능형 애플리케이션을 계속 구축하는 동시에 검색 노드를 통해 리소스 소비를 최적화하고 성능을 개선할 수 있습니다.

전체 공지 사항과 혜택 목록을 보려면 아래 블로그를 읽어보세요.

드디어 그 순간이 왔습니다. 인공 지능은 왼쪽으로 이동했습니다. 한때 구축되어 엔터프라이즈 전반의 데이터 사이언스 및 머신 러닝 팀에 갇히는 경우가 많았던 것이 이제는 모든 빌더가 쉽게 사용할 수 있습니다. 그러나 이러한 새로운 도구의 놀라운 기능을 활용하려면 안정적이고 구성 가능하며 세련된 데이터 플랫폼을 기반으로 구축해야 합니다. 동시에, 우리 모두가 보았듯이, 이러한 새로운 기능은 데이터 또는 소위 말하는 "참값" 만큼 훌륭합니다. 그렇기 때문에 MongoDB Atlas 개발자 데이터 플랫폼에 또 다른 기능을 추가하여 데이터의 잠재력을 최대한 활용하고 AI 애플리케이션을 구동할 수 있게 되어 매우 기쁩니다. 오늘날 MongoDB는 모든 형태의 데이터 수요를 충족하고 다양한 파트너들이 이러한 놀라운 새로운 기능을 활용할 수 있도록 설계된 흥미로운 새로운 Vector Search 기능을 발표하게 되어 기쁩니다.

MongoDB로 AI 기반 앱을 구축하는 방법에 대해 자세히 알아보려면 AI 리소스 페이지를 참조하세요.


어떤 기능인가요?

익숙하지 않은 분들을 위해 설명하자면, Vector Search는 데이터 자체가 아닌 의미 체계 또는 데이터의 의미에 따라 데이터를 쿼리할 수 있는 기능입니다. 이는 모든 형태의 데이터를 벡터로 수치적으로 표현할 수 있기 때문에 가능하며, 정교한 알고리즘을 통해 서로 비교할 수 있습니다. 첫 번째 단계는 텍스트, 오디오, 이미지 또는 비디오와 같은 소스 데이터를 가져와 "인코딩 모델"을 사용하여 "벡터" 또는 "임베딩"으로 변환하는 것입니다. 최근 인공 지능의 발전으로 이러한 벡터는 이제 데이터에 대한 더 많은 컨텍스트를 포함하는 더 높은 차원 공간에 더 낮은 차원 데이터를 투영하여 데이터의 의미를 더 잘 포착할 수 있습니다. 이 데이터가 이러한 숫자 표현으로 변환되면 쿼리하여 Approximate Nearest Neighbors 알고리즘으로 유사한 값을 찾을 수 있습니다. 이 알고리즘은 쿼리에서 유사한 벡터를 가진 데이터를 매우 빠르게 찾을 수 있습니다. 예를 들어, "슬픈 영화 검색" 또는 "...처럼 보이는 이미지 찾기" 등의 쿼리를 충족시킬 수 있습니다. 이 기능을 통해 완전히 새로운 수준의 능력을 발휘할 수 있습니다.

우리 플랫폼과 어떤 관련이 있습니까?

MongoDB Atlas에 기본적으로 내장된 이 기능을 사용하면 데이터를 복사/변환하거나, 새로운 스택/구문을 배우거나, 완전히 새로운 여러 인프라를 관리할 필요가 없습니다. MongoDB의 Atlas Vector Search를 사용하면 이러한 작업을 수행할 필요가 없으며, 세계 최고 수준의 실전 테스트를 거친 플랫폼에서 이러한 강력하고 새로운 기능을 모두 활용하여 그 어느 때보다 빠르게 애플리케이션을 구축할 수 있습니다. AI 및 Vector Search를 활용할 때 발생할 수 있는 여러 가지 어려운 점들은 애플리케이션 데이터를 안전하게 노출하는 것과 관련된 복잡성에서 비롯됩니다. 이러한 작업은 개발자 경험을 더욱 복잡하게 하여 애플리케이션의 구축, 디버그 및 유지 관리를 어렵게 만듭니다. MongoDB는 Vector Search의 강력한 기능을 플랫폼에 적용하고 수직 및 수평으로 유기적으로 확장함으로써 실제로 발생하는 모든 워크로드를 지원하여 이러한 문제를 해결합니다. 마지막으로, 보안 및 가용성에 대한 보장이 없다면 이 모든 것이 의미가 없습니다. 이중화 및 자동 페일오버를 통한 고가용성과 함께 안전한 데이터 관리 솔루션에 대한 MongoDB의 노력은 애플리케이션이 그 어떤 것도 놓치지 않도록 합니다.

MongoDB.local 런던의 새로운 소식

.Local 런던에서, $vectorSearch를 통해 호출할 수 있는 전용 Vector Search 집계 단계를 소개할 수 있게 되어 기쁘게 생각합니다. 이 집계 단계에는 몇 가지 신개념이 도입되어 새로운 기능을 추가하고 Vector Search를 그 어느 때보다 쉽게 활용할 수 있습니다. $vectorSearch를 사용하면 MQL 구문(예: $gte, $eq)과 함께 사전 필터를 활용할 수도 있습니다. 이 기능은 인덱스를 탐색할 때 문서를 필터링하여 일관된 결과와 높은 성능을 제공합니다. MongoDB를 이해하는 개발자라면 누구나 이 필터링 기능을 쉽게 활용할 수 있을 것입니다! 마지막으로, 집계 단계 내에서 결과를 조정하는 두 가지 방법인 "numCandidates" 및 "limit" 매개변수를 소개합니다. 이 매개변수를 사용하면 Approximate Nearest Neighbor 검색 대상이 될 문서 수를 조정한 다음 "limit"로 원하는 결과 수를 제한할 수 있습니다.

에코시스템과는 어떻게 작동하나요?

인공 지능을 중심으로 일어나는 혁신은 믿기 어려울 정도로 늘어나고 있으며, 오픈 소스 커뮤니티도 놀라울 정도로 빠르게 발전하고 있습니다. 오픈 소스 언어 모델은 물론 이를 애플리케이션에 통합할 수 있는 다양한 방법을 통해 엄청난 이점을 얻을 수 있습니다. 인공 지능이 제공하는 원초적인 힘과 함께, 개발자에게 필요한 유연성을 제공하는 기능에 대해 견고한 관념을 갖는 것이 그 어느 때보다 중요해졌습니다. 이에 따라, Vector Search 지원부터 채팅 로깅과 문서 인덱싱에 이르기까지 LangChain 및 LlamaIndex에서 지원되는 여러 기능을 공유할 수 있게 되어 기대가 큽니다. 이러한 상황에 맞게 저희는 발빠르게 대처하고 있으며, 최고의 공급자를 위한 새로운 기능을 지속적으로 출시할 것입니다.

끝맺음

이 모든 것은 이제 시작에 불과하며, MongoDB는 개발자들이 업계 최고의 개발자 데이터 플랫폼으로 차세대 AI 지원 애플리케이션을 개발할 수 있도록 최선을 다하고 있습니다. 또한 더 많은 프레임워크와 플러그인 아키텍처에 노력을 기울일 것입니다. 그렇지만 언제나 그렇듯이, 가장 중요한 것은 개발자입니다. 커뮤니티와 함께 논의하여 개발자들에게 가장 도움이 될 수있는 방법을 찾고, 모든 단계에서 필요한 부분을 충족할 수 있도록 할 것입니다. 망설이지말고 개발하세요!

Atlas Vector Search에 대해 자세히 알아보고 귀사에 적합한 솔루션인지 여부를 확인하려면 설명서, 백서튜토리얼을 확인하거나 지금 바로 시작하세요.