Einführung in LLM

Diese Seite bietet einen Leitfaden zu großen Sprachmodellen (LLM), von den Grundlagen bis hin zu Anwendungen für KI-Enthusiasten.


Insgesamt 18 Artikel verfügbar. | Aktuell auf Seite 1 von 1.

Kapitel 14 — Benchmarking, Testen und Performance

Fünfzehnter und letzter Beitrag der LLM-Primer-IV-Tour. Der MCP-Universe-Benchmark auf echten Servern, die zwei systemischen Fehlermodi, die er enthüllte, die Zehnfach-Durchsatzlücke zwischen Session-per-Request und geteilten Session-Pools und die Brücke zu Band V.

2026-04-12

Kapitel 13 — Frameworks und Cloud-Integration

Dreizehnter Beitrag der LLM-Primer-IV-Tour. Strands mit Bedrock, das AWS-State-Layer-Muster, das Microsoft Agent Framework, LangChain, Semantic Kernel — und die drei produktiven Integrationsformen, auf die Teams unabhängig immer wieder kommen.

2026-04-11

Kapitel 10 — Langzeit-Gedächtnis

Zehnter Beitrag der LLM-Primer-IV-Tour. Kurzfristgedächtnis über Fenster und ReAct-Scratchpads, Langfristgedächtnis über episodische Vektoren und semantische Stores und die Verdichtungstechniken, die einen Agenten über Stunden und Tage produktiv halten.

2026-04-08

Kapitel 11 — Kontinuierliche Updates und Pipeline-Optimierung

Elfter und letzter Beitrag der LLM-Primer-III-Tour. CDC und inkrementelle Indizierung halten den Korpus frisch, semantisches Caching und Model-Tiering halten die Latenz unten, und eine vierstufige Feedback-Schleife schließt die Lücke zwischen dem, was die Produktion dem Team sagt, und dem, was das Team tatsächlich ändert — plus eine Brücke zu Band IV über das Model Context Protocol.

2026-03-28

Kapitel 10 — Führende Evaluations-Frameworks

Zehnter Beitrag der LLM-Primer-III-Tour. Ein Feldführer zu den Frameworks, die die Evaluations-Triade in etwas verwandeln, das ein Team tatsächlich fahren kann — RAGAS, TruLens, DeepEval auf der einen Seite, Braintrust, LangSmith, Phoenix, Galileo, Opik auf der anderen, und die Evaluation Gap, die noch keiner geschlossen hat.

2026-03-27

Kapitel 9 — Die RAG-Evaluations-Triade

Neunter Beitrag der LLM-Primer-III-Tour. Ein RAG-System kann an drei verschiedenen Stellen versagen, und die Versagen sehen von außen identisch aus — die Evaluations-Triade aus Context Relevance, Groundedness und Answer Relevance ist das kleine Vokabular, das verhindert, dass man einen Bug repariert, während man einen anderen misst.

2026-03-26

Kapitel 8 — Datenanonymisierung in der RAG-Pipeline

Achter Beitrag der LLM-Primer-III-Tour. Pre-Generation gegen Post-Generation, die drei Technik-Familien — Masking, synthetischer Ersatz, differenzielle Privatsphäre — und der Utility-Privacy-Tradeoff, der bestimmt, ob das System überhaupt nützlich bleibt.

2026-03-25

Kapitel 6 — Bedrohungsmodelle und Schwachstellen von RAG

Sechster Beitrag der LLM-Primer-III-Tour. Die erweiterte Angriffsfläche von Retrieval — Korpus-Vergiftung, adversariale Chunks, indirekte Prompt Injection, Embedding-Inversion und das Confused-Deputy-Problem in agentischem RAG. Konkrete Angriffe, jeder demonstriert, jeder reproduzierbar.

2026-03-23

Kapitel 3 — Fortgeschrittene Chunking-Frameworks

Dritter Beitrag der LLM-Primer-III-Tour. Das Chunking-Spektrum von Fixgröße bis strukturbewusst, der Overlap-Mythos, die Kontextklippe, die Retrieval still zerstört, und die Techniken Contextual Retrieval und Late Chunking, die die Frontier neu geformt haben.

2026-03-20

LLM Primer III — Serieneinführung und Übersicht

Auftakt der kapitelweisen Tour durch Band III der LLM-Primer-Reihe — Enterprise-KI mit RAG. Warum Retrieval-Augmented Generation von außen einfach aussieht und in Wahrheit ein Stapel von Disziplinen ist, für wen das Buch geschrieben ist, und der Fahrplan für die elf Beiträge vom 18. bis 28. März.

2026-03-17

Kapitel 11 — Evaluation, Kalibrierung und Inferenz

Kapitel 11 der LLM Primer II Serie. Wie misst man eine Maschine, die alles sagen kann? Perplexity als günstiger intrinsischer Maßstab, Kalibrierung als die Frage, die oft wichtiger ist als Genauigkeit, Fehlerbalken als Gegenmittel zum Benchmark-Theater und Retrieval-Geometrie als das Produktionswerkzeug gegen Halluzinationen.

2026-03-13

Kapitel 10 — Mathematik des Post-Trainings und der Ausrichtung

Kapitel 10 der LLM Primer II Serie. Wie ein brillanter, aber wilder Next-Token-Predictor zu einem hilfreichen Assistenten gezähmt wird — Supervised Fine-Tuning, Reward-Modellierung mit Bradley-Terry, RLHF an der KL-Leine und die elegante DPO-Herleitung, die die gesamte RL-Pipeline in einen einzigen überwachten Verlust zusammenfaltet.

2026-03-12

Kapitel 12 — Dein eigenes LLM-System bauen: Von Datensätzen bis zur Produktion

Kapitel 12 der LLM Primer I Serie. Das Abschlusskapitel. Was es wirklich braucht, um ein LLM-getriebenes System End-to-End zu bauen — Datensatz-Lizenzierung, Trainings-Pipelines, Evaluations-Frameworks, der integrierte Anwendungs-Stack und die Fallstudien-Muster, die erfolgreiche Deployments von gescheiterten Piloten unterscheiden.

2026-03-01

Kapitel 9 — Leistung, Skalierung und Kosten: Die echten Engineering-Trade-offs

Kapitel 9 der LLM Primer I Serie. Die operativen Realitäten beim Betrieb von LLMs im großen Maßstab — Modellgröße versus Fähigkeit, der Trade-off zwischen Latenz und Throughput, Kostenökonomie, Quantisierung und Edge-Deployment. Warum Frontier-Modelle oft die falsche Wahl sind, selbst wenn du sie dir leisten kannst.

2026-02-26

Kapitel 8 — LLMs in Anwendungen einsetzen: Chatbots, Code, Extraktion und Agenten

Kapitel 8 der LLM Primer I Serie. Die Anwendungsmuster, die wirklich in Produktion ausgeliefert werden — Chatbots, Zusammenfassung, Code-Assistenten, strukturierte Extraktion und der Aufstieg agentischer Systeme, in denen das Modell eine Tool-Use-Schleife steuert. Plus die Benchmarks, die jeder Ingenieur namentlich kennen sollte.

2026-02-25

Kapitel 7 — Jenseits der Vorhersage des nächsten Tokens: Embeddings, Retrieval und Multimodalität

Kapitel 7 der LLM Primer I Serie. Die Fähigkeiten, die einen Next-Token-Predictor in viel mehr verwandeln — Embeddings, semantische Suche, Retrieval-Augmented Generation und der Übergang zu multimodalen Eingaben. Wie RAG ein LLM tatsächlich in echten Dokumenten geerdet hält, statt zu fabulieren.

2026-02-24

Eine Kapitel-für-Kapitel-Tour durch LLM Primer I — Einführung in die Serie und Index

Einführung und Index der zwölfteiligen Kapitel-für-Kapitel-Tour durch LLM Primer I: Wie generative KI funktioniert. Ein Post pro Tag, vom 18. Februar bis zum 1. März 2026. Lies sie in Reihenfolge oder wähle das Kapitel, das dich am meisten interessiert. Alle zwölf sind hier aufgelistet und verlinkt.

2026-02-17

Die LLM Primer Serie — Ein Feldhandbuch zur generativen KI, Band für Band aufgebaut

Die LLM Primer Serie — ein siebenbändiges Feldhandbuch zur generativen KI von Sho Shimoda. Jeder Band behandelt eine eigene Ebene der Arbeit mit großen Sprachmodellen, von den Grundlagen bis zur Sicherheit. Dies ist die Landingpage: ein Überblick über die gesamte Serie plus die laufende Kapitel-für-Kapitel-Tour durch die ersten Bände.

2026-02-15