Die LLM Primer Serie — Ein Feldhandbuch zur generativen KI, Band für Band aufgebaut

Veröffentlicht am: 2026-02-15 Zuletzt aktualisiert am: 2026-06-12 Version: 8
Die LLM Primer Serie — Ein Feldhandbuch zur generativen KI, Band für Band aufgebaut

Die LLM Primer Serie

Ein Feldhandbuch zur generativen KI, Band fĂŒr Band aufgebaut. Sieben BĂŒcher, jedes mit Fokus auf eine andere Ebene der Arbeit mit großen Sprachmodellen.


Worum es in dieser Serie geht

Die LLM Primer Serie ist eine strukturierte, mechanismusorientierte Behandlung großer Sprachmodelle — geschrieben fĂŒr Ingenieure, technische Produktmanager, neugierige Fachleute und jeden, der bereit ist, sorgfĂ€ltig zu lesen. Jeder Band behandelt einen Ausschnitt des Feldes in der Tiefe, mit erhaltener technischer PrĂ€zision und ErklĂ€rungen, die so geerdet sind, dass du sie tatsĂ€chlich nutzen kannst.

Die Serie ist so konzipiert, dass sie auf zwei Arten funktioniert. Du kannst Band I als vollstĂ€ndige Grundlage lesen und dort aufhören. Oder du folgst dem gesamten Verlauf — Grundlagen, Mathematik, Retrieval, Kontextdesign, Production Engineering, Skalierung, Sicherheit — und endest mit einem umfassenden praktischen Wissen darĂŒber, wie man verantwortungsvoll mit LLMs baut.

Alle BĂ€nde sind von Sho Shimoda geschrieben, CTO der Receipt Roller Inc., der KI-Systeme in Produktion baut und betreibt und so klar darĂŒber schreibt, dass jeder mitkommt.

FĂŒr wen das ist: Ingenieure und Architekten, die ein nachhaltiges VerstĂ€ndnis wollen. Produktmanager und FĂŒhrungskrĂ€fte, die entscheiden mĂŒssen, welche KI gebaut werden soll. Neugierige Fachleute und Studierende, die die Technologie hinter den Schlagzeilen verstehen wollen. Die Serie ist so geschrieben, dass du keine mathematische Vorbildung brauchst, behĂ€lt aber genug technische PrĂ€zision, dass ein erfahrener Ingenieur seine Zeit nicht verschwendet.

Wie du diese Seite liest

Jeder Band unten listet seine vollstĂ€ndige Gliederung, organisiert nach Teilen. Wir veröffentlichen einen Kapitel-fĂŒr-Kapitel-Begleitartikel fĂŒr jedes Kapitel der Serie. Kapitel, zu denen es bereits einen Begleitartikel gibt, sind verlinkt; Kapitel, deren Begleitartikel noch ausstehen, erscheinen als reiner Text.

Die AnhĂ€nge sind zur Transparenz aufgefĂŒhrt, sind aber buchexklusive Inhalte — Referenzmaterial, Cheat Sheets, Übungen mit Lösungen und anderes Material, das ans Ende des Buches gehört statt in einen separaten Begleitartikel. Wer die AnhĂ€nge will, liest das Buch.


Band I — Wie generative KI funktioniert

Ein klarer und praktischer Leitfaden zu den Grundlagen großer Sprachmodelle.

Die Auffahrt in einfacher Sprache zur gesamten Serie. Von Null beginnend — Tokens, Training und der einfache Akt, das nĂ€chste Wort vorherzusagen — baut er ein ehrliches, fachjargonfreies Bild davon auf, was ein großes Sprachmodell ist, wie es trainiert wird und warum es sich so verhĂ€lt, wie es sich verhĂ€lt, ohne Vorwissen vorauszusetzen. Es ist das Fundament, auf dem jeder spĂ€tere Band aufbaut.

Lies das Buch auf Amazon: LLM Primer I — How Generative AI Works

LLM Primer I Cover

EinfĂŒhrung in die Serie: Eine Kapitel-fĂŒr-Kapitel-Tour durch LLM Primer I — EinfĂŒhrung in die Serie und Index

Teil I — Konzepte und Grundlagen

Kapitel 1 —Was ist ein großes Sprachmodell?
Kapitel 2 —Wahrscheinlichkeit, Tokens und Text
Kapitel 3 —Neuronale Netze fĂŒr Sprache

Teil II — Wie LLMs funktionieren

Kapitel 4 —Die Transformer-Architektur
Kapitel 5 —Große Modelle trainieren
Kapitel 6 —Feinabstimmung und Adaption
Kapitel 7 —Jenseits der Vorhersage des nĂ€chsten Tokens

Teil III — Praktische Perspektiven

Kapitel 8 —LLMs in Anwendungen einsetzen
Kapitel 9 —Leistung, Skalierung und Kosten
Kapitel 10 —Sicherheit, Ethik und Vertrauen

Teil IV — Fortgeschrittene Themen

Kapitel 11 —Spitzenforschung
Kapitel 12 —Dein eigenes LLM-System bauen

AnhÀnge (nur im Buch)

Anhang A —LLM-Glossar
Anhang B —Mathematik hinter Attention
Anhang C —Prompting-Cheat-Sheet
Anhang D —Werkzeuge und Bibliotheken
Anhang E —Empfohlene LektĂŒre

Band II — Sprachmodelle durch Mathematik

Das Innenleben der KI mit mathematischem Einblick erkunden.

Eine mathematisch rigorose, aber lesbare Tour durch das Innenleben der KI: Attention, Optimierungsdynamik, Loss-Landschaften und Skalierungsverhalten, erklĂ€rt durch die Mathematik, die sie zum Laufen bringt. Jede Gleichung, auf die es ankommt, wird vollstĂ€ndig hergeleitet — jede eingebettet in eine Geschichte, eine Analogie und ein durchgerechnetes numerisches Beispiel. FĂŒr Leser, die die Mathematik wollen, die der erste Band in den Seitenleisten lĂ€sst.

Lies das Buch auf Amazon: LLM Primer II — Language Models Through Mathematics

LLM Primer II Cover

EinfĂŒhrung in die Serie: Eine Kapitel-fĂŒr-Kapitel-Tour durch LLM Primer II — EinfĂŒhrung in die Serie und Index

Teil I — Mathematische Grundlagen

Kapitel 1 —Mathematische Intuition fĂŒr Sprachmodelle
Kapitel 2 —LLMs im Kontext
Kapitel 3 —Mathematische Werkzeuge

Teil II — Architektur und Mechanik

Kapitel 4 —Attention
Kapitel 5 —Position, Reihenfolge und Sequenzstruktur
Kapitel 6 —Transformer-Blöcke
Kapitel 7 —Effizienz und Transformer-Varianten

Teil III — Training und Evaluation

Kapitel 8 —Wie Modelle lernen
Kapitel 9 —Training im großen Maßstab
Kapitel 10 —Mathematik des Post-Trainings und der Ausrichtung
Kapitel 11 —Evaluation, Kalibrierung und Inferenz

Teil IV — Anwendungen und Praxis

Kapitel 12 —Reale Anwendungen von LLMs
Kapitel 13 —Grenzen, Risiken und offene Herausforderungen
Kapitel 14 —Praktisches Wissen fĂŒr Ingenieure

AnhÀnge (nur im Buch)

Das LLM-Mathe-Cheat-Sheet
Eine statistische Perspektive auf LLMs
Fragen, die Menschen stellen
Durchgerechnete Herleitungen
Übungen mit Lösungen
Symbolverzeichnis
Ein vollstÀndiger Forward Pass, in Zahlen
Eine Zeitlinie der Ideen

Band III — Enterprise-KI mit RAG verstĂ€rken (Jetzt verfĂŒgbar)

Ein praktischer Leitfaden zum Bauen von Retrieval-Augmented-Generation-Systemen fĂŒr das Unternehmen.

Praktische Retrieval-Augmented Generation — Vektordatenbanken, Chunking-Strategien und die Architektur, ein Modell in deinen eigenen Dokumenten zu erden fĂŒr verlĂ€ssliche, aktuelle Enterprise-Antworten. Der Band, den du lesen solltest, wenn dein Job darin besteht, KI-Features auszuliefern, die aktuell bleiben und ihre Quellen zitieren mĂŒssen.

Auf Amazon lesen: LLM Primer III — Enterprise-KI mit RAG

LLM Primer III Cover

SerieneinfĂŒhrung: LLM Primer III — SerieneinfĂŒhrung und Index

Teil I — Grundlagen von Retrieval-Augmented Generation

Kapitel 1 —Die Evolution der RAG-Architektur

Teil II — Daten-Ingestion, Parsing und Chunking

Kapitel 2 —Intelligentes Dokumenten-Parsing
Kapitel 3 —Fortgeschrittene Chunking-Frameworks

Teil III — Vektordatenbanken und Retrieval-Optimierung

Kapitel 4 —Die richtige Vektordatenbank auswĂ€hlen
Kapitel 5 —Die Retrieval-Pipeline architektonisch gestalten

Teil IV — Sicherheit, Datenschutz und Zugriffskontrolle

Kapitel 6 —RAG-Bedrohungsmodelle und Schwachstellen
Kapitel 7 —Zugriffskontrolle implementieren
Kapitel 8 —Datenanonymisierung in der RAG-Pipeline

Teil V — Evaluation, Monitoring und Wartung

Kapitel 9 —Die RAG-Evaluations-Triade
Kapitel 10 —FĂŒhrende Evaluations-Frameworks
Kapitel 11 —Kontinuierliche Updates und Pipeline-Optimierung

AnhÀnge (nur im Buch)

Anhang A —Essentielle mathematische Formeln zur RAG-Optimierung
Anhang B —Beispiel-System-Prompts fĂŒr Datenanonymisierung und Evaluation
Anhang C —Entscheidungsmatrizen fĂŒr Vektordatenbanken und Werkzeuge
Anhang D —Benchmark-DatensĂ€tze fĂŒr RAG-Evaluation

Band IV — KI-Kognition mit MCP gestalten (Jetzt verfĂŒgbar)

Kontext, Werkzeuge und GedĂ€chtnis fĂŒr zuverlĂ€ssige KI-Agenten engineeren.

Strukturierte Kontextmodellierung und Orchestrierung: wie man das Reasoning eines Modells formt, indem man den Kontext und die Situationen gestaltet, die es sieht — statt das Modell selbst zu Ă€ndern. Der Band, den du lesen solltest, wenn du agentische Systeme baust — Werkzeuginventare, langlaufende Schleifen, GedĂ€chtnis ĂŒber Sessions hinweg und die Disziplin, zu gestalten, was das Modell ĂŒberhaupt sehen darf.

Auf Amazon lesen: LLM Primer IV — KI-Kognition mit MCP entwerfen

LLM Primer IV Cover

SerieneinfĂŒhrung: LLM Primer IV — SerieneinfĂŒhrung und Index

Teil I — Der Paradigmenwechsel bei der KI-Integration

Kapitel 1 —Die KI-Integrationskrise und der Aufstieg der agentischen Architektur
Kapitel 2 —Das Model Context Protocol (MCP) enthĂŒllen

Teil II — Kernmechanik des Model Context Protocol

Kapitel 3 —Server-Primitive — Kontext und FĂ€higkeiten exponieren
Kapitel 4 —Client-Primitive — Agentisches Verhalten und Kontrolle
Kapitel 5 —Transportprotokolle und Discovery

Teil III — Multi-Agenten-Orchestrierungsmuster

Kapitel 6 —Grundlegende Orchestrierungsstrategien
Kapitel 7 —Fortgeschrittene kollaborative und dynamische Muster
Kapitel 8 —Architektonische Deployment-Layouts

Teil IV — KI-Kognition gestalten: Kontext und GedĂ€chtnis

Kapitel 9 —Das Attention-Budget verwalten
Kapitel 10 —Langhorizont-Aufgaben-GedĂ€chtnis

Teil V — Agentische Workflows absichern

Kapitel 11 —AngriffsflĂ€chen und Protokoll-Schwachstellen
Kapitel 12 —Protokoll-HĂ€rtung und Verteidigung

Teil VI — Production Engineering und Skalierung

Kapitel 13 —Frameworks und Cloud-Integration
Kapitel 14 —Benchmarking, Testen und Performance

AnhÀnge (nur im Buch)

Anhang A —MCP-Schnellreferenz und Cheat Sheet
Anhang B —Implementierungs-Blueprints und Code-Beispiele
Anhang C —Production-Readiness- und Sicherheits-Checklisten
Anhang D —Erweiterte Spezifikationen und Standard Enhancement Proposals (SEPs)
Anhang E —Benchmarks und Performance-Daten
Anhang F —Offizielle Ressourcen und Ökosystem-Links

Band V — Reale LLM-Anwendungen bauen

LLM-Systeme in Produktion entwerfen, evaluieren und betreiben.

Ein systemfokussierter Leitfaden vom Prototyp zur Produktion — API-Design, Evaluations-Loops, Monitoring und Integration — der ein leistungsfĂ€higes Modell in ein verlĂ€ssliches Produkt verwandelt. Der Band, der architektonisches VerstĂ€ndnis in laufende Dienste mit echten Nutzern umsetzt.

LLM Primer V Cover

Teil I — Grundlagen des AI Engineering

Kapitel 1 —Die Disziplin des AI Engineering
Kapitel 2 —Foundation Models und Prompt Engineering

Teil II — Agentische und Retrieval-FĂ€higkeiten bauen

Kapitel 3 —Retrieval-Augmented Generation (RAG)
Kapitel 4 —KI-Agenten und Tool Calling

Teil III — QualitĂ€tssicherung und Observability

Kapitel 5 —LLM-Anwendungen evaluieren
Kapitel 6 —KI-Observability und Tracing

Teil IV — Sicherheit, Skalierung und Optimierung

Kapitel 7 —LLM-Sicherheit und Guardrails
Kapitel 8 —Performance, Serving und Kosten optimieren

AnhÀnge (nur im Buch)

Anhang A —Die Production-Readiness- und Sicherheits-Checklisten
Anhang B —Auswahlmatrizen fĂŒr Tools und Frameworks
Anhang C —Protokolle, Streaming und strukturierte Ausgaben
Anhang D —Rate Limiting und Architektur des Kostenmanagements
Anhang E —Glossar der AI-Engineering-Metriken und -Begriffe

Band VI — KI-Systeme skalieren

Low-Latency-LLM-Inferenz fĂŒr den Produktionsmaßstab architektonisch gestalten.

Hochleistungs-Inferenz architektonisch gestalten: verteiltes Serving, Latenzoptimierung und Kostenmodellierung fĂŒr Systeme, die Millionen Mal am Tag antworten mĂŒssen. Der Band, den du liest, wenn dein KI-System ĂŒber einen Server hinausgewachsen ist und sich nun wie ein echtes StĂŒck Infrastruktur verhalten muss.

LLM Primer VI Cover

Teil I — Die Grundlagen der LLM-Inferenz

Kapitel 1 —Die Mechanik der Token-Generierung
Kapitel 2 —Die Key-Value-Cache-Herausforderung

Teil II — Das Hardware-Substrat

Kapitel 3 —Rechenzentrums-GPUs fĂŒr generative KI
Kapitel 4 —Spezialisiertes KI-Silizium und ASICs

Teil III — Optimierung auf Modellebene (Kompression)

Kapitel 5 —Quantisierung entmystifizieren
Kapitel 6 —Pruning und Knowledge Distillation

Teil IV — Optimierungen auf System- und Engine-Ebene

Kapitel 7 —Fortgeschrittene Batching-Strategien
Kapitel 8 —KV-Cache-Management der nĂ€chsten Generation
Kapitel 9 —Speculative Decoding

Teil V — Serving-Frameworks und Orchestrierung

Kapitel 10 —Die LLM-Engine-Schicht
Kapitel 11 —Die Platform- und Orchestrierungsschicht
Kapitel 12 —Disaggregiertes Serving und Kubernetes
Kapitel 13 —Autoscaling und Cold-Start-Minderung

Teil VI — Anwendungsökonomie und TCO

Kapitel 14 —Token-Ökonomie und API-Pricing
Kapitel 15 —Serverless APIs vs. Dedizierte Infrastruktur
Kapitel 16 —Kostensenkungsstrategien in Produktion

AnhÀnge (nur im Buch)

Anhang A —Mathematische Formeln und Kostenmodellierungs-Referenz
Anhang B —Hardware- und Beschleuniger-Spezifikationsleitfaden
Anhang C —Deployment-Konfigurationen und Code-Snippets
Anhang D —Benchmarking-Methodik und Metrik-Definitionen

Band VII — KI-Sicherheit

LLM-Systeme gegen Prompt Injection, Jailbreaks und adversariale Bedrohungen verteidigen.

Sichere und robuste KI gestalten: adversariale Risiken, Prompt Injection, Governance-Frameworks und defensives Design fĂŒr Systeme, die in der realen Welt deployt werden. Der Band, den du liest, wenn dein KI-System als sicherheitsrelevante Infrastruktur ernst genommen werden muss.

LLM Primer VII Cover

Teil I — Grundlagen der KI-Sicherheit

Kapitel 1 —Warum KI-Sicherheit anders ist
Kapitel 2 —Threat Modeling fĂŒr LLM-Systeme
Kapitel 3 —Datensicherheit und Datenschutz

Teil II — Prompt- und Interaktionssicherheit

Kapitel 4 —Prompt Injection und Jailbreaks
Kapitel 5 —Eingabevalidierung und Ausgabefilterung
Kapitel 6 —Risiken von Retrieval-Augmented Generation

Teil III — Modellrobustheit und VerlĂ€sslichkeit

Kapitel 7 —Halluzinationen und VerlĂ€sslichkeit
Kapitel 8 —Adversariale Angriffe auf Modelle
Kapitel 9 —ModellintegritĂ€t und Supply-Chain-Risiken

Teil IV — Sicherheitsarchitektur auf Systemebene

Kapitel 10 —Sichere LLM-Architekturen entwerfen
Kapitel 11 —Observability, Logging und Incident Response
Kapitel 12 —Zugriffskontrolle und IdentitĂ€t

Teil V — Governance, Ethik und Compliance

Kapitel 13 —Regulatorische Landschaft
Kapitel 14 —Bias, Fairness und verantwortungsvolle KI
Kapitel 15 —Eine sichere KI-Organisation aufbauen

Teil VI — Fortgeschrittene Themen

Kapitel 16 —Sicheres Fine-Tuning und Adaption
Kapitel 17 —KĂŒnftige Bedrohungen und entstehende Verteidigungen

AnhÀnge (nur im Buch)

Anhang A —KI-Sicherheits-Checkliste fĂŒr Produktionssysteme
Anhang B —Beispiel-Threat-Model-Vorlage
Anhang C —Sichere Prompt-Design-Muster
Anhang D —Incident-Response-Vorlage fĂŒr LLM-Anwendungen
Anhang E —Empfohlene Werkzeuge und Frameworks

Wie diese Seite wÀchst

Diese Seite wird mit jedem veröffentlichten Band der Serie und mit dem Live-Gehen jedes Kapitel-Begleitartikels aktualisiert. FĂŒr die BĂ€nde III bis VII sind oben die vollstĂ€ndigen Inhaltsverzeichnisse aufgefĂŒhrt; die Begleitartikel zu diesen Kapiteln werden hinzugefĂŒgt, sobald sie geschrieben sind.

Markiere diese Seite als Lesezeichen, wenn du die Serie verfolgen möchtest, wÀhrend sie sich entfaltet. Oder abonniere den Channel-Feed, um jeden neuen Beitrag am Tag seiner Veröffentlichung zu erhalten.


Fang mit Band I an. Zwölf Kapitel, vollstĂ€ndig fĂŒr 2026 ĂŒberarbeitet, mit Diagrammen, "In einfacher Sprache"-KĂ€sten, Codebeispielen und einer vollstĂ€ndigen Behandlung dessen, wie generative KI wirklich funktioniert. Hol dir LLM Primer I auf Amazon →
Geh dann mit Band II tiefer. Die Mathematik unter der Maschinerie — Attention als Geometrie, Training als Optimierung, Ausrichtung als Statistik. Vierzehn Kapitel, jede wichtige Gleichung vollstĂ€ndig hergeleitet, jede mit einer Geschichte, einer Analogie und einem durchgerechneten Beispiel. Hol dir LLM Primer II auf Amazon →

SHO
SHO