RAG (검색 증강 생성)
정의
외부 지식을 검색하여 AI 응답의 정확성을 높이는 기술
#RAG#LLM#벡터DB
RAG란?
RAG(Retrieval-Augmented Generation)는 AI 모델이 답변을 생성하기 전에 외부 데이터베이스에서 관련 정보를 먼저 검색하고, 그 정보를 참고하여 더 정확한 답변을 만들어내는 기술입니다.
비유하자면, RAG는 오픈북 시험을 보는 학생과 같습니다. 기존 LLM이 머릿속 기억에만 의존해 답을 쓰는 학생이라면, RAG는 시험 중에 교과서와 참고자료를 펼쳐보고 정확한 내용을 확인한 뒤 답안을 작성하는 학생입니다.
어떻게 작동하나요?
RAG는 크게 세 단계로 작동합니다.
- 색인(Indexing): 문서들을 작은 조각으로 나누고 벡터 임베딩으로 변환하여 벡터 데이터베이스에 저장합니다.
- 검색(Retrieval): 사용자 질문이 들어오면 의미적으로 유사한 문서 조각을 벡터 DB에서 찾아냅니다.
- 생성(Generation): 검색된 문서를 컨텍스트로 함께 전달하여 LLM이 근거 있는 답변을 생성합니다.
왜 중요한가요?
RAG는 LLM의 대표적 약점인 할루시네이션을 줄여줍니다. 학습 데이터에 없는 최신 정보나 기업 내부 문서 같은 전문 지식도 활용할 수 있어, 기업용 AI 챗봇이나 고객 지원 시스템에서 특히 널리 사용됩니다. 모델 자체를 재학습할 필요 없이 데이터만 업데이트하면 되므로 비용도 절감됩니다.
AI 검색에 내 사이트는 노출되고 있을까?
ChatGPT·Perplexity·Gemini가 내 브랜드를 어떻게 답하는지 무료로 확인해 보세요.
지금 진단 시작 →관련 용어
자연어 처리 (NLP)
에이전트 (AI Agent)
스스로 판단하고 도구를 활용해 작업을 수행하는 자율 AI
자연어 처리 (NLP)
청크 (Chunk)
긴 문서를 검색과 생성 품질을 위해 의미 단위로 나눈 텍스트 조각
자연어 처리 (NLP)
컨텍스트 윈도우 (Context Window)
AI 모델이 한 번에 읽고 처리할 수 있는 입력 토큰의 최대 범위
자연어 처리 (NLP)
토큰 (Token)
AI가 텍스트를 처리하는 최소 단위
자연어 처리 (NLP)
파인튜닝 (Fine-tuning)
사전 학습된 AI 모델을 특정 목적에 맞게 추가 학습시키는 기술
자연어 처리 (NLP)
프롬프트 (Prompt)
AI 모델에게 원하는 결과를 얻기 위해 입력하는 지시문