Vector RAG
Vector RAG는 RAG의 가장 일반적인 형태로, 검색 단계에서 임베딩 벡터의 유사도를 사용합니다. 별다른 수식어 없이 그냥 "RAG"라고 부르면 보통 이 방식을 가리킵니다.
기본 흐름:
- 문서를 청크(chunk) 단위로 자름
- 각 청크를 Embedding 모델로 벡터화해 벡터 DB(Pinecone, Weaviate, Chroma 등)에 저장
- 사용자 질문이 들어오면 질문도 같은 임베딩으로 벡터화
- 벡터 DB에서 유사도 상위 N개 청크를 검색
- 검색된 청크를 컨텍스트로 LLM에 넘겨 답변 생성
장점은 단순하고, 인덱싱 비용이 Graph RAG보다 훨씬 싸고, 도입이 쉽다는 점입니다. 대부분의 RAG 시스템이 여기서 출발합니다.
단점은 다단계 관계가 필요한 질문("X의 멘토의 멘토는?")이나 글로벌 질문("이 컬렉션의 핵심 주제는?")에 약합니다. 이런 한계가 Graph RAG가 등장한 배경입니다.