'검색기반생성' 태그의 글 목록

[LangChain RAG 구축 시리즈 Ep.13] 🧪 Stuff / MapReduce / Refine 전략 비교

이 글에서는 RAG 시스템에서 여러 개의 문서가 검색되었을 때,GPT가 어떤 방식으로 응답을 생성할지를 결정하는문서 조합 전략(Combining Strategy) 3가지 — Stuff, MapReduce, Refine 를 비교해봅니다.🔍 문서 조합 전략이란?검색된 여러 문서를 LLM에게 어떻게 전달할 것인지를 결정하는 전략입니다. 전략 방식 stuff모든 문서를 한 번에 LLM에 전달map_reduce각 문서별로 응답 후, 전체 응답을 정리refine첫 문서로 응답한 뒤, 나머지 문서로 점진적 개선🧠 각 전략의 특징 전략 장점 단점 Stuff빠름, 간단문서가 많으면 context overflowMapReduce안정적 처리시간 오래 걸림Refine정교함 ↑불필요하게 verbose 해질 수 있음📦..

LLM & Generative AI/RAG in Practice 2025.04.05

[LangChain RAG 구축 시리즈 Ep.12] 🧵 대화형 검색과 맥락 기억 기능 구현해보기

이 글에서는 GPT 기반 RAG 시스템에 대화 기능과 맥락 유지(memory) 기능을 추가하여사용자가 연속적인 질문을 할 수 있도록 만들어보겠습니다.바로 ConversationalRetrievalChain의 등장입니다!🧠 ConversationalRetrievalChain이란?단일 질의 응답이 아닌, 이전 질문과 답변을 바탕으로 문맥을 기억하며 이어지는 대화를 가능하게 하는 RAG 체인입니다. 특징 설명 🧵 대화 흐름 유지앞선 질문 내용을 기억🧠 메모리 사용ConversationBufferMemory로 과거 대화 저장🔗 Retriever + LLM 통합문서 검색 + 문맥형 응답 생성📦 기본 흐름[질문1] → 문서 검색 → GPT 응답[질문2] (이전 내용 기억) → 문서 검색 → GPT 응답...

LLM & Generative AI/RAG in Practice 2025.04.05

[LangChain RAG 구축 시리즈 Ep.07] 💬 사용자 질문을 벡터와 어떻게 매칭할까?

이 글에서는 RAG 시스템에서 사용자 질문을 어떻게 벡터로 변환하고,그 벡터가 문서와 어떤 방식으로 매칭되는지를 실제 원리와 예시를 통해 쉽게 설명합니다.🎯 오늘의 주제 요약“사용자 질문도 벡터로 바꾼 다음,이미 저장된 문서 벡터들과 비교해서가장 유사한 것(top-k)을 고른다.”이 과정을 정확히 이해하면 RAG 검색기의 작동 방식이 명확해집니다.🔢 Step 1: 사용자 질문 → 벡터로 변환사용자가 "상품 정보를 담고 있는 테이블이 뭐야?"라고 질문하면,이 문장은 아래처럼 벡터로 변환됩니다. (예시)[0.124, -0.554, 0.223, ..., 0.039] # 1536차원의 벡터➡️ 이 벡터는 embedding.embed_query()를 통해 생성됩니다.🧠 Step 2: 문서 벡터들과 거리 계..

LLM & Generative AI/RAG in Practice 2025.04.05

[LangChain RAG 구축 시리즈 Ep.03] 🧠 LLM은 어디까지 알고 있을까? 외부 지식의 필요성

이 글에서는 RAG 시스템이 왜 필요한지를 LLM의 한계를 중심으로 살펴보겠습니다.GPT와 같은 모델은 매우 똑똑해 보이지만, 알고 있는 정보에는 한계가 있습니다.그리고 바로 이 한계를 극복하기 위한 해법이 RAG입니다.❓ GPT는 정말 모든 걸 알고 있을까?많은 분들이 GPT-4는 모든 걸 알고 있다고 생각합니다.하지만 실제로는 훈련 당시 데이터까지만 알고 있으며,그 이후에 생긴 지식은 모릅니다.예를 들어…🧪 질문: “2024년 12월에 발표된 Iceberg 최신 버전의 주요 기능은?” 🤖 GPT 응답: "죄송합니다. 제 지식은 2023년까지입니다."즉, GPT는 현재 정보에 대해 답할 수 없습니다.💥 LLM이 스스로 모르는 것 예시 설명 🔄 최신 테이블 구조 변경metadata.json 파..

LLM & Generative AI/RAG in Practice 2025.04.05

[LangChain RAG 구축 시리즈 Ep.01] 🔍 RAG를 구성하는 핵심 컴포넌트 4가지

이 글에서는 RAG 시스템을 구성하는 핵심 요소(Component) 4가지를 소개하고,이들이 어떻게 상호작용하며 전체 검색-생성 흐름을 만드는지 알기 쉽게 정리해드립니다.✨ RAG 시스템 전체 흐름 요약먼저 전체 그림을 한눈에 보고 시작하겠습니다.[사용자 질문] ↓[문서 검색기 Retriever] ↓ ⟵ 벡터화된 문서 저장소(VectorDB)[선택된 문서 + 질문] ↓[LLM (GPT-3.5/4 등)] ↓[최종 답변 생성]핵심 키워드: 검색기(Retriever) + 언어 모델(LLM) + 문서 저장소(VectorDB)📦 RAG 구성 요소 4가지✅ 1. 문서 임베딩 & 벡터스토어 (Vector Store)역할: 텍스트 문서(예: metadata.json) → 숫..

LLM & Generative AI/RAG in Practice 2025.04.05

YG Tech Blog

검색기반생성 5

티스토리툴바

« 2025/04 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30