Einführung in LLM

Diese Seite bietet einen Leitfaden zu großen Sprachmodellen (LLM), von den Grundlagen bis hin zu Anwendungen für KI-Enthusiasten.


Insgesamt 16 Artikel verfügbar. | Aktuell auf Seite 1 von 1.

Kapitel 10 — Langzeit-Gedächtnis

Zehnter Beitrag der LLM-Primer-IV-Tour. Kurzfristgedächtnis über Fenster und ReAct-Scratchpads, Langfristgedächtnis über episodische Vektoren und semantische Stores und die Verdichtungstechniken, die einen Agenten über Stunden und Tage produktiv halten.

2026-04-08

Kapitel 11 — Kontinuierliche Updates und Pipeline-Optimierung

Elfter und letzter Beitrag der LLM-Primer-III-Tour. CDC und inkrementelle Indizierung halten den Korpus frisch, semantisches Caching und Model-Tiering halten die Latenz unten, und eine vierstufige Feedback-Schleife schließt die Lücke zwischen dem, was die Produktion dem Team sagt, und dem, was das Team tatsächlich ändert — plus eine Brücke zu Band IV über das Model Context Protocol.

2026-03-28

Kapitel 10 — Führende Evaluations-Frameworks

Zehnter Beitrag der LLM-Primer-III-Tour. Ein Feldführer zu den Frameworks, die die Evaluations-Triade in etwas verwandeln, das ein Team tatsächlich fahren kann — RAGAS, TruLens, DeepEval auf der einen Seite, Braintrust, LangSmith, Phoenix, Galileo, Opik auf der anderen, und die Evaluation Gap, die noch keiner geschlossen hat.

2026-03-27

Kapitel 9 — Die RAG-Evaluations-Triade

Neunter Beitrag der LLM-Primer-III-Tour. Ein RAG-System kann an drei verschiedenen Stellen versagen, und die Versagen sehen von außen identisch aus — die Evaluations-Triade aus Context Relevance, Groundedness und Answer Relevance ist das kleine Vokabular, das verhindert, dass man einen Bug repariert, während man einen anderen misst.

2026-03-26

Kapitel 8 — Datenanonymisierung in der RAG-Pipeline

Achter Beitrag der LLM-Primer-III-Tour. Pre-Generation gegen Post-Generation, die drei Technik-Familien — Masking, synthetischer Ersatz, differenzielle Privatsphäre — und der Utility-Privacy-Tradeoff, der bestimmt, ob das System überhaupt nützlich bleibt.

2026-03-25

Kapitel 7 — Zugriffskontrolle umsetzen

Siebter Beitrag der LLM-Primer-III-Tour. Dokumentbezogene ACLs als Fundament, RBAC mit Microsoft Purview Sensitivity Labels, ReBAC mit Zanzibar und SpiceDB und die Pre-Filter-gegen-Post-Filter-Disziplin, die unter allen läuft.

2026-03-24

Kapitel 6 — Bedrohungsmodelle und Schwachstellen von RAG

Sechster Beitrag der LLM-Primer-III-Tour. Die erweiterte Angriffsfläche von Retrieval — Korpus-Vergiftung, adversariale Chunks, indirekte Prompt Injection, Embedding-Inversion und das Confused-Deputy-Problem in agentischem RAG. Konkrete Angriffe, jeder demonstriert, jeder reproduzierbar.

2026-03-23

Kapitel 5 — Die Retrieval-Pipeline architektonisch denken

Fünfter Beitrag der LLM-Primer-III-Tour. Warum eine einzelne Vektorsuche keine Pipeline ist — hybrides Retrieval, Reciprocal Rank Fusion, Cross-Encoder-Reranking und query-seitiges Rewriting und HyDE — zusammengesetzt zur Produktionsarchitektur, auf die gereifte RAG-Systeme zulaufen.

2026-03-22

Kapitel 4 — Die richtige Vektordatenbank wählen

Vierter Beitrag der LLM-Primer-III-Tour. Die architektonische Trennung zwischen purpose-built Vektordatenbanken und Postgres-artigen Erweiterungen, die Managed-Leader (Pinecone, Vertex), das Open-Source-Feld (Qdrant, Milvus, Weaviate), die Embedded-Optionen und die drei operativen Achsen — Residency, Betrieb, Kosten — die die echte Wahl treffen.

2026-03-21

Kapitel 3 — Fortgeschrittene Chunking-Frameworks

Dritter Beitrag der LLM-Primer-III-Tour. Das Chunking-Spektrum von Fixgröße bis strukturbewusst, der Overlap-Mythos, die Kontextklippe, die Retrieval still zerstört, und die Techniken Contextual Retrieval und Late Chunking, die die Frontier neu geformt haben.

2026-03-20

Kapitel 2 — Intelligentes Document-Parsing

Zweiter Beitrag der LLM-Primer-III-Tour. Warum eine PDF keine Textdatei ist, was layoutbewusste Parser tatsächlich erhalten, die aktuelle Werkzeuglandschaft (LlamaParse, Docling, Unstructured, Marker-PDF, Firecrawl, DeepSeek-OCR) und der multimodale Pfad, der direkt über Seitenbilder abruft.

2026-03-19

Kapitel 1 — Die Evolution der RAG-Architektur

Erster Beitrag der LLM-Primer-III-Tour. Die vier architektonischen Haltungen von RAG — Naive, Advanced, Modular, Agentic — lesen sich als eine Geschichte darüber, wie man dem LLM Schritt für Schritt mehr Handlungsspielraum übergibt, und die ehrliche Antwort darauf, wann Fine-Tuning das bessere Werkzeug ist als Retrieval.

2026-03-18

Kapitel 11 — Evaluation, Kalibrierung und Inferenz

Kapitel 11 der LLM Primer II Serie. Wie misst man eine Maschine, die alles sagen kann? Perplexity als günstiger intrinsischer Maßstab, Kalibrierung als die Frage, die oft wichtiger ist als Genauigkeit, Fehlerbalken als Gegenmittel zum Benchmark-Theater und Retrieval-Geometrie als das Produktionswerkzeug gegen Halluzinationen.

2026-03-13

Kapitel 7 — Jenseits der Vorhersage des nächsten Tokens: Embeddings, Retrieval und Multimodalität

Kapitel 7 der LLM Primer I Serie. Die Fähigkeiten, die einen Next-Token-Predictor in viel mehr verwandeln — Embeddings, semantische Suche, Retrieval-Augmented Generation und der Übergang zu multimodalen Eingaben. Wie RAG ein LLM tatsächlich in echten Dokumenten geerdet hält, statt zu fabulieren.

2026-02-24

Kapitel 4 — Die Transformer-Architektur: Im Motor moderner KI

Kapitel 4 der LLM Primer I Serie. Eine Tour durch den Transformer-Block — wie Self-Attention, Positional Encoding und gestapelte Schichten zusammenwirken, um die Architektur zu erzeugen, auf der jedes moderne LLM aufgebaut ist. Mit einer klaren Erklärung, warum das Skalieren von Transformern funktioniert und was es kostet.

2026-02-21

Kapitel 2 — Wahrscheinlichkeit, Tokens und Text: Das Spiel der nächsten-Wort-Vorhersage

Kapitel 2 der LLM Primer I Serie. Wie LLMs Text in Tokens umwandeln, warum Sprachmodellierung fundamental ein Wahrscheinlichkeitsproblem ist und wie der alte n-gramm-Ansatz neuronalen Modellen wich, die generalisieren können. Mit Erklärungen in einfacher Sprache zu Perplexity und dazu, warum Token-Grenzen wichtig sind.

2026-02-19