

Future Engineering
기술의 최전선을 기록합니다.
[9장] AI 데이터 모델링과 MongoDB 도입 전략
![[9장] AI 데이터 모델링과 MongoDB 도입 전략](https://d2gg9iclns4v4e.cloudfront.net/images/news/1727055984203_mongodb.webp)
언더바를 피하는 컬럼 및 인덱스 설정
AI 데이터 모델링에서 많은 개발자들이 아직도 언더바(_)를 사용한 컬럼과 인덱스를 활용하고 있지만, 이는 피해야 할 중요한 요소 중 하나로 꼽힌다. 모델링뿐만 아니라 데이터의 구조적 설계도 AI 시스템에서 매우 중요하다. 데이터를 어떻게 관리하고 구조화하는지가 AI 성능에 직접적인 영향을 미치기 때문이다.
데이터와 모델의 균형
많은 개발자들이 모델링에만 집중하는 경향이 있지만, 데이터 자체도 모델만큼 중요하다. 데이터를 잘 다루는 것이 AI 시스템에서 중요한 역할을 하며, 실시간 운영 쿼리와 실시간 분석 쿼리 같은 데이터 처리 과정에서 데이터 구조는 핵심적인 역할을 한다.
전통적인 데이터베이스에서 AI 도입의 어려움
기존 전통적인 데이터베이스(RDBMS)를 사용하면서 AI 도입을 시도하는 기업들이 있는데, 이는 많은 어려움을 수반할 수 있다. RDBMS는 AI 기반 시스템의 요구 사항에 맞게 확장되기 어려우며, 데이터 구조와 스키마 관리의 문제로 인해 점진적 확장이 필요해진다. 특히, 오랜 기간 리팩토링이 없었던 시스템에서 스키마 문제가 발생할 수 있으며, 이는 AI 데이터 모델링의 걸림돌이 될 수 있다.
백터 검색 도입의 필요성
전통적인 일반 검색에서 벗어나 벡터 검색 도입을 고민해야 할 시기가 다가오고 있다. 벡터 검색은 일반 검색보다 AI 시스템에서 더 정확하고 효율적인 결과를 제공할 수 있다. 그러나 아직까지는 벡터 검색을 완벽히 도입한 회사는 드물다.
-
벡터 검색과 검색의 차이점: 벡터 검색은 일반 검색보다 데이터의 확장성에서 큰 차이를 보인다. 이는 특히 LLM(대형 언어 모델) 기반 AI 시스템에서 더 중요한 역할을 한다. 벡터 검색은 완벽하지 않지만, 일반 검색보다 더 나은 성능을 제공한다.
데이터 모델링의 중요성 및 벡터 검색의 한계
AI 데이터 모델링에서는 벡터 검색을 도입하면서 발생하는 저장 비용과 성능 문제가 큰 과제로 남아 있다. 이를 해결하는 방법 중 하나로 하이브리드 서치(Hybrid Search)가 제시된다. 하이브리드 서치는 벡터 검색과 전통적인 검색을 혼합하여, 성능과 비용 사이에서 적절한 균형을 유지할 수 있다.
-
저장 비용: 벡터 검색은 데이터를 처리하고 저장하는 데 많은 비용이 들 수 있지만, 이를 통해 더 정확한 검색 결과를 얻을 수 있다. 하이브리드 서치는 이러한 문제를 해결하는 한 가지 방법이다.
NoSQL과 AI 데이터 저장의 트렌드
2022년부터 MongoDB는 데이터베이스 순위 1위를 기록하며, 많은 기업이 AI 시스템을 위한 데이터 저장소로 NoSQL을 선택하고 있다. AI는 점점 더 많은 데이터를 필요로 하고 있으며, 기존의 RDBMS 구조가 이 요구를 충족시키기에 어려움을 겪기 시작했다. 따라서 많은 AI 개발자들은 MongoDB와 같은 NoSQL 시스템을 선택하여 AI 개발에 활용하고 있다.
-
미래의 불확실성: AI 데이터 모델링은 아직 완성된 기술이 아니며, 앞으로 어떻게 발전할지 예측할 수 없다. 그러나 많은 기업과 개발자들이 MongoDB를 통해 AI 개발을 진행하고 있으며, NoSQL로의 데이터 저장 전환이 가속화되고 있다.
결론
AI 데이터 모델링에서 MongoDB와 같은 NoSQL 시스템은 점점 더 중요한 역할을 하고 있다. 전통적인 RDBMS는 AI의 요구를 충족하기 어렵고, 벡터 검색과 같은 최신 기술을 도입하는 데 한계를 보인다. 이를 해결하기 위해 MongoDB로 전환하는 사례가 증가하고 있으며, AI 시스템의 성능을 향상시키기 위한 하이브리드 서치와 벡터 검색 등의 기술 도입이 필수적이다. MongoDB는 이러한 AI 데이터 저장 요구를 충족시키는 주요 플랫폼으로 자리 잡고 있으며, 미래에도 계속해서 중요한 역할을 할 것이다.