Einführung in LLM
Diese Seite bietet einen Leitfaden zu großen Sprachmodellen (LLM), von den Grundlagen bis hin zu Anwendungen für KI-Enthusiasten.
Kapitel 14 — Benchmarking, Testen und Performance
Fünfzehnter und letzter Beitrag der LLM-Primer-IV-Tour. Der MCP-Universe-Benchmark auf echten Servern, die zwei systemischen Fehlermodi, die er enthüllte, die Zehnfach-Durchsatzlücke zwischen Session-per-Request und geteilten Session-Pools und die Brücke zu Band V.
2026-04-12Kapitel 13 — Frameworks und Cloud-Integration
Dreizehnter Beitrag der LLM-Primer-IV-Tour. Strands mit Bedrock, das AWS-State-Layer-Muster, das Microsoft Agent Framework, LangChain, Semantic Kernel — und die drei produktiven Integrationsformen, auf die Teams unabhängig immer wieder kommen.
2026-04-11Kapitel 12 — Protokoll-Härtung und Verteidigungen
Zwölfter Beitrag der LLM-Primer-IV-Tour. Die vier Verteidigungs-Cluster — kryptographische Attestation, OAuth-Scope-Disziplin mit begrenzten Sessions, Laufzeit-Sandboxing und Human-in-the-Loop-Gates — komponieren zu einer Haltung, die nicht davon abhängt, dass sich das Modell unter adversariellen Bedingungen korrekt verhält.
2026-04-10Kapitel 8 — Architektonische Deployment-Layouts
Achter Beitrag der LLM-Primer-IV-Tour. Die drei Deployment-Layouts, die im MCP-Ökosystem entstanden sind — wiederverwendbarer Agent, strenge Reinheit, Hybrid — und die vier bindenden Beschränkungen, die entscheiden, welches zu welchem Projekt passt.
2026-04-06Kapitel 7 — Fortgeschrittene kollaborative und dynamische Muster
Siebter Beitrag der LLM-Primer-IV-Tour. Roundtable-Konsens, Handoff-Routing und magentische Orchestrierung — die Muster, die entstehen, wenn die Topologie pro Request gebaut werden muss, mit den Fehlermodi (Nicht-Terminierung, Fehlrouting, durchgegangenes Planen), die die einfacheren Muster vermeiden.
2026-04-05Kapitel 11 — Kontinuierliche Updates und Pipeline-Optimierung
Elfter und letzter Beitrag der LLM-Primer-III-Tour. CDC und inkrementelle Indizierung halten den Korpus frisch, semantisches Caching und Model-Tiering halten die Latenz unten, und eine vierstufige Feedback-Schleife schließt die Lücke zwischen dem, was die Produktion dem Team sagt, und dem, was das Team tatsächlich ändert — plus eine Brücke zu Band IV über das Model Context Protocol.
2026-03-28Kapitel 10 — Führende Evaluations-Frameworks
Zehnter Beitrag der LLM-Primer-III-Tour. Ein Feldführer zu den Frameworks, die die Evaluations-Triade in etwas verwandeln, das ein Team tatsächlich fahren kann — RAGAS, TruLens, DeepEval auf der einen Seite, Braintrust, LangSmith, Phoenix, Galileo, Opik auf der anderen, und die Evaluation Gap, die noch keiner geschlossen hat.
2026-03-27Kapitel 9 — Die RAG-Evaluations-Triade
Neunter Beitrag der LLM-Primer-III-Tour. Ein RAG-System kann an drei verschiedenen Stellen versagen, und die Versagen sehen von außen identisch aus — die Evaluations-Triade aus Context Relevance, Groundedness und Answer Relevance ist das kleine Vokabular, das verhindert, dass man einen Bug repariert, während man einen anderen misst.
2026-03-26Kapitel 8 — Datenanonymisierung in der RAG-Pipeline
Achter Beitrag der LLM-Primer-III-Tour. Pre-Generation gegen Post-Generation, die drei Technik-Familien — Masking, synthetischer Ersatz, differenzielle Privatsphäre — und der Utility-Privacy-Tradeoff, der bestimmt, ob das System überhaupt nützlich bleibt.
2026-03-25LLM Primer III — Serieneinführung und Übersicht
Auftakt der kapitelweisen Tour durch Band III der LLM-Primer-Reihe — Enterprise-KI mit RAG. Warum Retrieval-Augmented Generation von außen einfach aussieht und in Wahrheit ein Stapel von Disziplinen ist, für wen das Buch geschrieben ist, und der Fahrplan für die elf Beiträge vom 18. bis 28. März.
2026-03-17Kapitel 12 — Dein eigenes LLM-System bauen: Von Datensätzen bis zur Produktion
Kapitel 12 der LLM Primer I Serie. Das Abschlusskapitel. Was es wirklich braucht, um ein LLM-getriebenes System End-to-End zu bauen — Datensatz-Lizenzierung, Trainings-Pipelines, Evaluations-Frameworks, der integrierte Anwendungs-Stack und die Fallstudien-Muster, die erfolgreiche Deployments von gescheiterten Piloten unterscheiden.
2026-03-01Kapitel 11 — Spitzenforschung: MoE, Reasoning-Modelle und die neue Skalierungsachse
Kapitel 11 der LLM Primer I Serie. Die Forschungsfronten, die jetzt Produktionsrealität sind — Mixture-of-Experts, Retrieval-Memory, native multimodale Tokenisierung, kontinuierliches Lernen und das Inference-Time-Scaling-Paradigma, das die heutigen Reasoning-Modelle hervorgebracht hat. Die größte inhaltliche Erweiterung der Ausgabe 2026.
2026-02-28Eine Kapitel-für-Kapitel-Tour durch LLM Primer I — Einführung in die Serie und Index
Einführung und Index der zwölfteiligen Kapitel-für-Kapitel-Tour durch LLM Primer I: Wie generative KI funktioniert. Ein Post pro Tag, vom 18. Februar bis zum 1. März 2026. Lies sie in Reihenfolge oder wähle das Kapitel, das dich am meisten interessiert. Alle zwölf sind hier aufgelistet und verlinkt.
2026-02-17Die LLM Primer Serie — Ein Feldhandbuch zur generativen KI, Band für Band aufgebaut
Die LLM Primer Serie — ein siebenbändiges Feldhandbuch zur generativen KI von Sho Shimoda. Jeder Band behandelt eine eigene Ebene der Arbeit mit großen Sprachmodellen, von den Grundlagen bis zur Sicherheit. Dies ist die Landingpage: ein Überblick über die gesamte Serie plus die laufende Kapitel-für-Kapitel-Tour durch die ersten Bände.
2026-02-15