벡터 데이터베이스 (Vector DB)
AI 임베딩 벡터를 저장하고 유사도 기반으로 검색하는 전문 데이터베이스
#벡터DB#임베딩#검색
벡터 데이터베이스란?
벡터 데이터베이스(Vector Database)는 텍스트, 이미지, 오디오 같은 데이터를 숫자 벡터(임베딩)로 변환하여 저장하고, 의미적 유사도를 기반으로 빠르게 검색할 수 있는 특수한 데이터베이스입니다.
비유하자면, 도서관의 사서가 책 내용의 의미를 이해하는 것과 같습니다. 일반 데이터베이스가 책 제목이나 저자명으로만 검색할 수 있는 도서관이라면, 벡터 데이터베이스는 "우주의 기원에 대한 철학적 논의"라고 질문했을 때 관련된 모든 책을 의미적으로 찾아주는 똑똑한 사서입니다.
어떻게 작동하나요?
- 임베딩 변환: AI 모델이 텍스트나 이미지를 수백~수천 차원의 숫자 배열(벡터)로 변환합니다. 의미가 비슷한 데이터는 가까운 벡터값을 갖게 됩니다.
- 인덱싱: 벡터들을 효율적으로 검색할 수 있도록 특수한 인덱스 구조로 저장합니다.
- 유사도 검색: 쿼리 벡터와 가장 가까운 벡터들을 코사인 유사도 등의 방법으로 찾아냅니다.
대표 서비스
- Pinecone: 완전 관리형 클라우드 벡터 DB
- Weaviate: 오픈소스 벡터 검색 엔진
- ChromaDB: 가벼운 오픈소스 벡터 DB로 프로토타이핑에 적합
- pgvector: PostgreSQL 확장으로 기존 DB에 벡터 검색 추가
벡터 데이터베이스는 RAG 시스템, 추천 시스템, 의미 기반 검색 등 현대 AI 애플리케이션의 필수 인프라로 자리잡고 있습니다.
관련 용어
AI 인프라/모델 최적화
경사하강법 (Gradient Descent)
손실 함수를 최소화하기 위해 기울기 반대 방향으로 파라미터를 반복 업데이트하는 최적화 방법
AI 인프라/모델 최적화
딥러닝 (Deep Learning)
다층 신경망을 이용해 데이터의 복잡한 표현을 자동으로 학습하는 머신러닝 접근
AI 인프라/모델 최적화
레이트 리미팅 (Rate Limiting)
짧은 시간에 과도한 요청이 몰릴 때 API 호출량을 제한하는 제어 기법
AI 인프라/모델 최적화
로봇 파운데이션 모델 (Robot Foundation Model)
대규모 로봇 데이터와 멀티모달 입력으로 사전 학습되어 다양한 물리 작업에 전이 가능한 범용 로봇 AI 모델
AI 인프라/모델 최적화
로컬 AI (Local AI)
모델을 외부 API가 아닌 자체 PC·서버에서 직접 실행하는 방식
AI 인프라/모델 최적화
모델 증류 (Model Distillation)
대형 모델의 출력 신호를 활용해 더 작은 모델을 학습시키는 경량화 기법