Weitere Ressourcen

Weitere Ressourcen#

Erweiterte RAG-Techniken#

Hybride Suche#

Kombiniere Vektor-Suche mit traditioneller Keyword-Suche für bessere Ergebnisse:

Verbesserungen für Produktionssysteme#

Reranking: Verwende spezialisierte Modelle um Ergebnisse zu verbessern
Query Expansion: Erweitere Suchanfragen automatisch
Chunk Overlap: Optimiere Überlappung zwischen Text-Chunks
Metadaten-Filtering: Nutze Dokumenten-Metadaten für präzisere Suche

Vektor-Datenbanken#

Open Source#

Chroma - Einfach zu verwenden, lokal oder gehostet
FAISS - Von Meta entwickelt, sehr schnell
Weaviate - Vollständige Vektor-Datenbank mit GraphQL
Qdrant - Rust-basiert, sehr performant

Kommerzielle Lösungen#

Pinecone - Managed Vektor-Datenbank

Embedding-Modelle#

Mehrsprachige Modelle#

multilingual-e5 - Unterstützt 100+ Sprachen
BGE-M3 - Multilinguale, Multi-Granularität

Wissenschaftliche Modelle#

SciBERT - Speziell für wissenschaftliche Texte
PubMedBERT - Für biomedizinische Literatur

RAG-Frameworks#

LangChain#

LangChain Python - Umfassendes Framework
LangChain Expression Language (LCEL) - Für komplexe Pipelines

LlamaIndex#

LlamaIndex - Fokus auf Daten-Integration

Haystack#

Haystack - Von deepset, sehr flexibel

Wissenschaftliche Paper und Tools#

Grundlagen-Paper#

RAG: Retrieval-Augmented Generation - Original RAG Paper
Dense Passage Retrieval - DPR für bessere Retrieval

Wissenschaftliche RAG-Systeme#

PaperQA - RAG für wissenschaftliche Literatur
ScholarQA - Allen Institute’s Wissenschafts-QA

Evaluation#

RAGAS - Framework für RAG-Evaluation
TruLens - Evaluation und Monitoring von LLM-Apps

Implementierungs-Beispiele#

GitHub Repositories#

RAG from Scratch - LangChain’s Tutorial-Serie
Verba - Open Source RAG-Interface

Nächste Schritte#

Nach diesem Tutorial kannst du:

Experimentiere mit verschiedenen Embedding-Modellen - Teste, welches für deine Dokumente am besten funktioniert
Verwende eine Vektor-Datenbank - Skaliere dein System für größere Dokumentensammlungen
Implementiere Evaluation - Messe die Qualität deiner RAG-Antworten
Baue eine Web-Interface - Erstelle eine benutzerfreundliche Oberfläche mit Streamlit oder FastAPI
Erweitere um Multimodal-Support - Integriere Bilder und Tabellen aus PDFs

Kontakt#

Hast du Fragen oder Verbesserungsvorschläge?

GitHub Issues: rag-tutorial/issues
LamaLab Website: lamalab.org

Viel Erfolg beim Aufbau deines RAG-Systems! 🚀