RAG es LangChain: Teljes utmutato a Retrieval-Augmented Generation-hoz

spinny:~/writing $ less rag-langchain-deep-dive.md

1 
2A nagy nyelvi modellek (LLM-ek) mint a GPT-4 es a Claude rendkivul hatalmasak, de alapveto korlattal rendelkeznek: tudasuk a tanitas pillanatahoz van rogzitve. A **Retrieval-Augmented Generation (RAG)** pontosan ezt a problemat oldja meg az LLM-ek generativ erejenek es a kulso forrasokbol valo informaciolekeretes kepessegenek kombinalaasval.
3 
4## A problema: Az LLM-ek korlаtai
5 
61.  **Statikus tudas**: Egy LLM csak azt tudja, amit a tanitas soran latott.
72.  **Hallucinaciok**: Ha egy LLM nem tudja a valaszt, hajlamos kitalalni egyet.
83.  **Nincs hozzaferes privat adatokhoz**: Egy generikus LLM nem fer hozza a vallalatod belso dokumentaciоjahoz.
9 
10## Mi az a RAG?
11 
12```mermaid
13graph LR
14    User["User"] -- "Question" --> Retriever
15    Retriever -- "Search relevant\ndocuments" --> VectorStore["Vector Store"]
16    VectorStore -- "Relevant\ndocuments" --> Retriever
17    Retriever -- "Context + Question" --> LLM
18    LLM -- "Grounded\nresponse" --> User
19```
20 
21## Hogyan mukodik a RAG reszletesen
22 
23### 1. fazis: Indexeles
24 
25```mermaid
26graph TD
27    A["Documents\n(PDF, HTML, MD, DB)"] --> B["Document Loader"]
28    B --> C["Text Splitter"]
29    C --> D["Text Chunks"]
30    D --> E["Embedding Model"]
31    E --> F["Numerical Vectors"]
32    F --> G["Vector Store\n(ChromaDB, Pinecone, FAISS)"]
33```
34 
35### 2. fazis: Lekeretes + Generalas
36 
37## RAG Pipeline epitese LangChain-nel
38 
39```bash
40pip install langchain langchain-openai langchain-community chromadb
41```
42 
43```python
44from langchain_community.document_loaders import PyPDFLoader
45from langchain.text_splitter import RecursiveCharacterTextSplitter
46from langchain_openai import OpenAIEmbeddings, ChatOpenAI
47from langchain_community.vectorstores import Chroma
48from langchain_core.prompts import ChatPromptTemplate
49from langchain_core.runnables import RunnablePassthrough
50from langchain_core.output_parsers import StrOutputParser
51 
52# Dokumentumok betoltese es feldarabolasa
53pdf_docs = PyPDFLoader("docs/manual.pdf").load()
54chunks = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=200).split_documents(pdf_docs)
55 
56# Embedding-ek es vector store
57vectorstore = Chroma.from_documents(
58    documents=chunks,
59    embedding=OpenAIEmbeddings(model="text-embedding-3-small"),
60    persist_directory="./chroma_db",
61)
62 
63# RAG lanc
64llm = ChatOpenAI(model="gpt-4o", temperature=0)
65retriever = vectorstore.as_retriever(search_type="similarity", search_kwargs={"k": 4})
66 
67prompt = ChatPromptTemplate.from_template("""
68Answer the question based only on the provided context.
69If the context does not contain enough information, say you don't know.
70 
71Context:
72{context}
73 
74Question: {question}
75 
76Answer:
77""")
78 
79def format_docs(docs):
80    return "\n\n".join(doc.page_content for doc in docs)
81 
82rag_chain = (
83    {"context": retriever | format_docs, "question": RunnablePassthrough()}
84    | prompt
85    | llm
86    | StrOutputParser()
87)
88```
89 
90## Halado RAG technikak
91 
92Ide tartozik a Multi-Query Retrieval, kontextualis tomorities, hibrid kereses es beszelgeteses RAG memoriaval.
93 
94## Bevalt gyakorlatok
95 
961.  Kiserletezz kulonbozo fragmentum-meretekkel (500-1500 token).
972.  Hasznalj dokumentum-metaadatokat.
983.  Ertekeld a minosegett frameworkokkel mint a [RAGAS](https://docs.ragas.io/).
994.  Implementalj ujrafeldolgozasi pipeline-t a dokumentum-frissitesekhez.
1005.  Adj hozza re-rankert a kezdeti lekeretes utan.
101 
102## Osszefoglalas
103 
104A RAG szabvanyos architekturava valt specifikus, naprakesz tudashoz hozzafero AI alkalmazasok epiteshez. A LangChain jelentosen leegyszerüsiti a megvalositast.
105

:RAG es LangChain: Teljes utmutato a Retrieval-Augmented Generation-hozlines 1-105 (END) — press q to close

2A nagy nyelvi modellek (LLM-ek) mint a GPT-4 es a Claude rendkivul hatalmasak, de alapveto korlattal rendelkeznek: tudasuk a tanitas pillanatahoz van rogzitve. A **Retrieval-Augmented Generation (RAG)** pontosan ezt a problemat oldja meg az LLM-ek generativ erejenek es a kulso forrasokbol valo informaciolekeretes kepessegenek kombinalaasval.

4## A problema: Az LLM-ek korlаtai

61. **Statikus tudas**: Egy LLM csak azt tudja, amit a tanitas soran latott.

72. **Hallucinaciok**: Ha egy LLM nem tudja a valaszt, hajlamos kitalalni egyet.

83. **Nincs hozzaferes privat adatokhoz**: Egy generikus LLM nem fer hozza a vallalatod belso dokumentaciоjahoz.

10## Mi az a RAG?

12```mermaid

13graph LR

14 User["User"] -- "Question" --> Retriever

15 Retriever -- "Search relevant\ndocuments" --> VectorStore["Vector Store"]

16 VectorStore -- "Relevant\ndocuments" --> Retriever

17 Retriever -- "Context + Question" --> LLM

18 LLM -- "Grounded\nresponse" --> User

19```

21## Hogyan mukodik a RAG reszletesen

23### 1. fazis: Indexeles

25```mermaid

26graph TD

27 A["Documents\n(PDF, HTML, MD, DB)"] --> B["Document Loader"]

28 B --> C["Text Splitter"]

29 C --> D["Text Chunks"]

30 D --> E["Embedding Model"]

31 E --> F["Numerical Vectors"]

32 F --> G["Vector Store\n(ChromaDB, Pinecone, FAISS)"]

33```

35### 2. fazis: Lekeretes + Generalas

37## RAG Pipeline epitese LangChain-nel

39```bash

40pip install langchain langchain-openai langchain-community chromadb

41```

43```python

44from langchain_community.document_loaders import PyPDFLoader

45from langchain.text_splitter import RecursiveCharacterTextSplitter

46from langchain_openai import OpenAIEmbeddings, ChatOpenAI

47from langchain_community.vectorstores import Chroma

48from langchain_core.prompts import ChatPromptTemplate

49from langchain_core.runnables import RunnablePassthrough

50from langchain_core.output_parsers import StrOutputParser

52# Dokumentumok betoltese es feldarabolasa

53pdf_docs = PyPDFLoader("docs/manual.pdf").load()

54chunks = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=200).split_documents(pdf_docs)

56# Embedding-ek es vector store

57vectorstore = Chroma.from_documents(

58 documents=chunks,

59 embedding=OpenAIEmbeddings(model="text-embedding-3-small"),

60 persist_directory="./chroma_db",

61)

63# RAG lanc

64llm = ChatOpenAI(model="gpt-4o", temperature=0)

65retriever = vectorstore.as_retriever(search_type="similarity", search_kwargs={"k": 4})

67prompt = ChatPromptTemplate.from_template("""

68Answer the question based only on the provided context.

69If the context does not contain enough information, say you don't know.

71Context:

72{context}

74Question: {question}

76Answer:

77""")

79def format_docs(docs):

80 return "\n\n".join(doc.page_content for doc in docs)

82rag_chain = (

83 {"context": retriever | format_docs, "question": RunnablePassthrough()}

84 | prompt

85 | llm

86 | StrOutputParser()

87)

88```

90## Halado RAG technikak

92Ide tartozik a Multi-Query Retrieval, kontextualis tomorities, hibrid kereses es beszelgeteses RAG memoriaval.

94## Bevalt gyakorlatok

961. Kiserletezz kulonbozo fragmentum-meretekkel (500-1500 token).

972. Hasznalj dokumentum-metaadatokat.

983. Ertekeld a minosegett frameworkokkel mint a [RAGAS](https://docs.ragas.io/).

994. Implementalj ujrafeldolgozasi pipeline-t a dokumentum-frissitesekhez.

1005. Adj hozza re-rankert a kezdeti lekeretes utan.

101

102## Osszefoglalas

103

104A RAG szabvanyos architekturava valt specifikus, naprakesz tudashoz hozzafero AI alkalmazasok epiteshez. A LangChain jelentosen leegyszerüsiti a megvalositast.

105