Die LLM Primer Serie

Ein siebenbändiges Feldhandbuch zur generativen KI von Sho Shimoda — jetzt vollständig.

Worum es in dieser Serie geht

Die LLM Primer Serie ist eine strukturierte, mechanismusorientierte Behandlung großer Sprachmodelle — geschrieben für Ingenieure, technische Produktmanager, neugierige Fachleute und jeden, der bereit ist, sorgfältig zu lesen. Alle sieben Bände sind nun veröffentlicht: von den Grundlagen der Vorhersage des nächsten Tokens bis zur Absicherung von Systemen gegen adversariale Bedrohungen. Jeder Band behandelt einen Ausschnitt des Feldes in der Tiefe, mit erhaltener technischer Präzision und Erklärungen, die so geerdet sind, dass du sie tatsächlich nutzen kannst.

Die Serie ist so konzipiert, dass sie auf zwei Arten funktioniert. Du kannst Band I als vollständige Grundlage lesen und dort aufhören. Oder du folgst dem gesamten Verlauf — Grundlagen, Mathematik, Retrieval, Kontextdesign, Production Engineering, Skalierung, Sicherheit — und endest mit einem umfassenden praktischen Wissen darüber, wie man verantwortungsvoll mit LLMs baut. Ein Schwesterband, Physical AI, erweitert die Behandlung auf verkörperte Systeme — Roboter, autonome Fahrzeuge und Agenten, die auf die physische Welt einwirken.

Alle Bände sind von Sho Shimoda geschrieben, Gründer und Ingenieur, der KI-Systeme in Produktion baut und betreibt und so klar darüber schreibt, dass jeder mitkommt.

Für wen das ist: Ingenieure und Architekten, die ein nachhaltiges Verständnis wollen. Produktmanager und Führungskräfte, die entscheiden müssen, welche KI gebaut werden soll. Neugierige Fachleute und Studierende, die die Technologie hinter den Schlagzeilen verstehen wollen. Die Serie ist so geschrieben, dass du keine mathematische Vorbildung brauchst, behält aber genug technische Präzision, dass ein erfahrener Ingenieur seine Zeit nicht verschwendet.

Wie du diese Seite liest

Jeder Band unten listet seine vollständige Gliederung, organisiert nach Teilen. Wir veröffentlichen einen Kapitel-für-Kapitel-Begleitartikel für jedes Kapitel der Serie. Kapitel, zu denen es bereits einen Begleitartikel gibt, sind verlinkt; Kapitel, deren Begleitartikel noch ausstehen, erscheinen als reiner Text.

Die Anhänge sind zur Transparenz aufgeführt, sind aber buchexklusive Inhalte — Referenzmaterial, Cheat Sheets, Übungen mit Lösungen und anderes Material, das ans Ende des Buches gehört statt in einen separaten Begleitartikel. Wer die Anhänge will, liest das Buch.

Band I — Wie generative KI funktioniert

Ein klarer und praktischer Leitfaden zu den Grundlagen großer Sprachmodelle.

Die Auffahrt in einfacher Sprache zur gesamten Serie. Von Null beginnend — Tokens, Training und der einfache Akt, das nächste Wort vorherzusagen — baut er ein ehrliches, fachjargonfreies Bild davon auf, was ein großes Sprachmodell ist, wie es trainiert wird und warum es sich so verhält, wie es sich verhält, ohne Vorwissen vorauszusetzen. Es ist das Fundament, auf dem jeder spätere Band aufbaut.

Lies das Buch auf Amazon: LLM Primer I — How Generative AI Works

Einführung in die Serie: Eine Kapitel-für-Kapitel-Tour durch LLM Primer I — Einführung in die Serie und Index

Teil I — Konzepte und Grundlagen

Kapitel 1 —	Was ist ein großes Sprachmodell?
Kapitel 2 —	Wahrscheinlichkeit, Tokens und Text
Kapitel 3 —	Neuronale Netze für Sprache

Teil II — Wie LLMs funktionieren

Kapitel 4 —	Die Transformer-Architektur
Kapitel 5 —	Große Modelle trainieren
Kapitel 6 —	Feinabstimmung und Adaption
Kapitel 7 —	Jenseits der Vorhersage des nächsten Tokens

Teil III — Praktische Perspektiven

Kapitel 8 —	LLMs in Anwendungen einsetzen
Kapitel 9 —	Leistung, Skalierung und Kosten
Kapitel 10 —	Sicherheit, Ethik und Vertrauen

Teil IV — Fortgeschrittene Themen

Kapitel 11 —	Spitzenforschung
Kapitel 12 —	Dein eigenes LLM-System bauen

Anhänge (nur im Buch)

Anhang A —	LLM-Glossar
Anhang B —	Mathematik hinter Attention
Anhang C —	Prompting-Cheat-Sheet

Anhang D —	Werkzeuge und Bibliotheken
Anhang E —	Empfohlene Lektüre

Band II — Sprachmodelle durch Mathematik

Das Innenleben der KI mit mathematischem Einblick erkunden.

Eine mathematisch rigorose, aber lesbare Tour durch das Innenleben der KI: Attention, Optimierungsdynamik, Loss-Landschaften und Skalierungsverhalten, erklärt durch die Mathematik, die sie zum Laufen bringt. Jede Gleichung, auf die es ankommt, wird vollständig hergeleitet — jede eingebettet in eine Geschichte, eine Analogie und ein durchgerechnetes numerisches Beispiel. Für Leser, die die Mathematik wollen, die der erste Band in den Seitenleisten lässt.

Lies das Buch auf Amazon: LLM Primer II — Language Models Through Mathematics

Einführung in die Serie: Eine Kapitel-für-Kapitel-Tour durch LLM Primer II — Einführung in die Serie und Index

Teil I — Mathematische Grundlagen

Kapitel 1 —	Mathematische Intuition für Sprachmodelle
Kapitel 2 —	LLMs im Kontext
Kapitel 3 —	Mathematische Werkzeuge

Teil II — Architektur und Mechanik

Kapitel 4 —	Attention
Kapitel 5 —	Position, Reihenfolge und Sequenzstruktur
Kapitel 6 —	Transformer-Blöcke
Kapitel 7 —	Effizienz und Transformer-Varianten

Teil III — Training und Evaluation

Kapitel 8 —	Wie Modelle lernen
Kapitel 9 —	Training im großen Maßstab
Kapitel 10 —	Mathematik des Post-Trainings und der Ausrichtung
Kapitel 11 —	Evaluation, Kalibrierung und Inferenz

Teil IV — Anwendungen und Praxis

Kapitel 12 —	Reale Anwendungen von LLMs
Kapitel 13 —	Grenzen, Risiken und offene Herausforderungen
Kapitel 14 —	Praktisches Wissen für Ingenieure

Anhänge (nur im Buch)

Das LLM-Mathe-Cheat-Sheet

Eine statistische Perspektive auf LLMs

Fragen, die Menschen stellen

Durchgerechnete Herleitungen

Übungen mit Lösungen

Symbolverzeichnis

Ein vollständiger Forward Pass, in Zahlen

Eine Zeitlinie der Ideen

Band III — Enterprise-KI mit RAG verstärken

Ein praktischer Leitfaden zum Bauen von Retrieval-Augmented-Generation-Systemen für das Unternehmen.

Praktische Retrieval-Augmented Generation — Vektordatenbanken, Chunking-Strategien und die Architektur, ein Modell in deinen eigenen Dokumenten zu erden für verlässliche, aktuelle Enterprise-Antworten. Der Band, den du lesen solltest, wenn dein Job darin besteht, KI-Features auszuliefern, die aktuell bleiben und ihre Quellen zitieren müssen.

Auf Amazon lesen: LLM Primer III — Enterprise-KI mit RAG

Serieneinführung: LLM Primer III — Serieneinführung und Index

Teil I — Grundlagen von Retrieval-Augmented Generation

Kapitel 1 —

Die Evolution der RAG-Architektur

Teil II — Daten-Ingestion, Parsing und Chunking

Kapitel 2 —	Intelligentes Dokumenten-Parsing
Kapitel 3 —	Fortgeschrittene Chunking-Frameworks

Teil III — Vektordatenbanken und Retrieval-Optimierung

Kapitel 4 —	Die richtige Vektordatenbank auswählen
Kapitel 5 —	Die Retrieval-Pipeline architektonisch gestalten

Teil IV — Sicherheit, Datenschutz und Zugriffskontrolle

Kapitel 6 —	RAG-Bedrohungsmodelle und Schwachstellen
Kapitel 7 —	Zugriffskontrolle implementieren
Kapitel 8 —	Datenanonymisierung in der RAG-Pipeline

Teil V — Evaluation, Monitoring und Wartung

Kapitel 9 —	Die RAG-Evaluations-Triade
Kapitel 10 —	Führende Evaluations-Frameworks
Kapitel 11 —	Kontinuierliche Updates und Pipeline-Optimierung

Anhänge (nur im Buch)

Anhang A —	Essentielle mathematische Formeln zur RAG-Optimierung
Anhang B —	Beispiel-System-Prompts für Datenanonymisierung und Evaluation

Anhang C —	Entscheidungsmatrizen für Vektordatenbanken und Werkzeuge
Anhang D —	Benchmark-Datensätze für RAG-Evaluation

Band IV — KI-Kognition mit MCP gestalten

Kontext, Werkzeuge und Gedächtnis für zuverlässige KI-Agenten engineeren.

Strukturierte Kontextmodellierung und Orchestrierung: wie man das Reasoning eines Modells formt, indem man den Kontext und die Situationen gestaltet, die es sieht — statt das Modell selbst zu ändern. Der Band, den du lesen solltest, wenn du agentische Systeme baust — Werkzeuginventare, langlaufende Schleifen, Gedächtnis über Sessions hinweg und die Disziplin, zu gestalten, was das Modell überhaupt sehen darf.

Auf Amazon lesen: LLM Primer IV — KI-Kognition mit MCP entwerfen

Serieneinführung: LLM Primer IV — Serieneinführung und Index

Teil I — Der Paradigmenwechsel bei der KI-Integration

Kapitel 1 —	Die KI-Integrationskrise und der Aufstieg der agentischen Architektur
Kapitel 2 —	Das Model Context Protocol (MCP) enthüllen

Teil II — Kernmechanik des Model Context Protocol

Kapitel 3 —	Server-Primitive — Kontext und Fähigkeiten exponieren
Kapitel 4 —	Client-Primitive — Agentisches Verhalten und Kontrolle
Kapitel 5 —	Transportprotokolle und Discovery

Teil III — Multi-Agenten-Orchestrierungsmuster

Kapitel 6 —	Grundlegende Orchestrierungsstrategien
Kapitel 7 —	Fortgeschrittene kollaborative und dynamische Muster
Kapitel 8 —	Architektonische Deployment-Layouts

Teil IV — KI-Kognition gestalten: Kontext und Gedächtnis

Kapitel 9 —	Das Attention-Budget verwalten
Kapitel 10 —	Langhorizont-Aufgaben-Gedächtnis

Teil V — Agentische Workflows absichern

Kapitel 11 —	Angriffsflächen und Protokoll-Schwachstellen
Kapitel 12 —	Protokoll-Härtung und Verteidigung

Teil VI — Production Engineering und Skalierung

Kapitel 13 —	Frameworks und Cloud-Integration
Kapitel 14 —	Benchmarking, Testen und Performance

Anhänge (nur im Buch)

Anhang A —	MCP-Schnellreferenz und Cheat Sheet
Anhang B —	Implementierungs-Blueprints und Code-Beispiele
Anhang C —	Production-Readiness- und Sicherheits-Checklisten

Anhang D —	Erweiterte Spezifikationen und Standard Enhancement Proposals (SEPs)
Anhang E —	Benchmarks und Performance-Daten
Anhang F —	Offizielle Ressourcen und Ökosystem-Links

Band V — Reale LLM-Anwendungen bauen

LLM-Systeme in Produktion entwerfen, evaluieren und betreiben.

Ein systemfokussierter Leitfaden vom Prototyp zur Produktion — API-Design, Evaluations-Loops, Monitoring und Integration — der ein leistungsfähiges Modell in ein verlässliches Produkt verwandelt. Der Band, der architektonisches Verständnis in laufende Dienste mit echten Nutzern umsetzt.

Jetzt auf Amazon verfügbar. LLM Primer V auf Amazon ansehen →

Serieneinführung: LLM Primer V — Serieneinführung und Index

Teil I — Grundlagen des AI Engineering

Kapitel 1 —	Die Disziplin des AI Engineering
Kapitel 2 —	Foundation Models und Prompt Engineering

Teil II — Agentische und Retrieval-Fähigkeiten bauen

Kapitel 3 —	Retrieval-Augmented Generation (RAG)
Kapitel 4 —	KI-Agenten und Tool Calling

Teil III — Qualitätssicherung und Observability

Kapitel 5 —	LLM-Anwendungen evaluieren
Kapitel 6 —	KI-Observability und Tracing

Teil IV — Sicherheit, Skalierung und Optimierung

Kapitel 7 —	LLM-Sicherheit und Guardrails
Kapitel 8 —	Performance, Serving und Kosten optimieren

Anhänge (nur im Buch)

Anhang A —	Die Production-Readiness- und Sicherheits-Checklisten
Anhang B —	Auswahlmatrizen für Tools und Frameworks
Anhang C —	Protokolle, Streaming und strukturierte Ausgaben

Anhang D —	Rate Limiting und Architektur des Kostenmanagements
Anhang E —	Glossar der AI-Engineering-Metriken und -Begriffe

Band VI — KI-Systeme skalieren

Low-Latency-LLM-Inferenz für den Produktionsmaßstab architektonisch gestalten.

Hochleistungs-Inferenz architektonisch gestalten: verteiltes Serving, Latenzoptimierung und Kostenmodellierung für Systeme, die Millionen Mal am Tag antworten müssen. Der Band, den du liest, wenn dein KI-System über einen Server hinausgewachsen ist und sich nun wie ein echtes Stück Infrastruktur verhalten muss.

Jetzt auf Amazon verfügbar. LLM Primer VI auf Amazon ansehen →

Serieneinführung: LLM Primer VI — Serieneinführung und Index

Teil I — Die Grundlagen der LLM-Inferenz

Kapitel 1 —	Die Mechanik der Token-Generierung
Kapitel 2 —	Die Key-Value-Cache-Herausforderung

Teil II — Das Hardware-Substrat

Kapitel 3 —	Rechenzentrums-GPUs für generative KI
Kapitel 4 —	Spezialisiertes KI-Silizium und ASICs

Teil III — Optimierung auf Modellebene (Kompression)

Kapitel 5 —	Quantisierung entmystifizieren
Kapitel 6 —	Pruning und Knowledge Distillation

Teil IV — Optimierungen auf System- und Engine-Ebene

Kapitel 7 —	Fortgeschrittene Batching-Strategien
Kapitel 8 —	KV-Cache-Management der nächsten Generation
Kapitel 9 —	Speculative Decoding

Teil V — Serving-Frameworks und Orchestrierung

Kapitel 10 —	Die LLM-Engine-Schicht
Kapitel 11 —	Die Platform- und Orchestrierungsschicht
Kapitel 12 —	Disaggregiertes Serving und Kubernetes
Kapitel 13 —	Autoscaling und Cold-Start-Minderung

Teil VI — Anwendungsökonomie und TCO

Kapitel 14 —	Token-Ökonomie und API-Pricing
Kapitel 15 —	Serverless APIs vs. Dedizierte Infrastruktur
Kapitel 16 —	Kostensenkungsstrategien in Produktion

Anhänge (nur im Buch)

Anhang A —	Mathematische Formeln und Kostenmodellierungs-Referenz
Anhang B —	Hardware- und Beschleuniger-Spezifikationsleitfaden

Anhang C —	Deployment-Konfigurationen und Code-Snippets
Anhang D —	Benchmarking-Methodik und Metrik-Definitionen

Band VII — KI-Sicherheit

LLM-Systeme gegen Prompt Injection, Jailbreaks und adversariale Bedrohungen verteidigen.

Sichere und robuste KI gestalten: adversariale Risiken, Prompt Injection, Governance-Frameworks und defensives Design für Systeme, die in der realen Welt deployt werden. Der Band, den du liest, wenn dein KI-System als sicherheitsrelevante Infrastruktur ernst genommen werden muss.

Jetzt auf Amazon verfügbar. LLM Primer VII auf Amazon ansehen →

Serieneinführung: LLM Primer VII — Serieneinführung und Index

Teil I — Grundlagen der KI-Sicherheit

Kapitel 1 —	Warum KI-Sicherheit anders ist
Kapitel 2 —	Threat Modeling für LLM-Systeme
Kapitel 3 —	Datensicherheit und Datenschutz

Teil II — Prompt- und Interaktionssicherheit

Kapitel 4 —	Prompt Injection und Jailbreaks
Kapitel 5 —	Eingabevalidierung und Ausgabefilterung
Kapitel 6 —	Risiken von Retrieval-Augmented Generation

Teil III — Modellrobustheit und Verlässlichkeit

Kapitel 7 —	Halluzinationen und Verlässlichkeit
Kapitel 8 —	Adversariale Angriffe auf Modelle
Kapitel 9 —	Modellintegrität und Supply-Chain-Risiken

Teil IV — Sicherheitsarchitektur auf Systemebene

Kapitel 10 —	Sichere LLM-Architekturen entwerfen
Kapitel 11 —	Observability, Logging und Incident Response
Kapitel 12 —	Zugriffskontrolle und Identität

Teil V — Governance, Ethik und Compliance

Kapitel 13 —	Regulatorische Landschaft
Kapitel 14 —	Bias, Fairness und verantwortungsvolle KI
Kapitel 15 —	Eine sichere KI-Organisation aufbauen

Teil VI — Fortgeschrittene Themen

Kapitel 16 —	Sicheres Fine-Tuning und Adaption
Kapitel 17 —	Künftige Bedrohungen und entstehende Verteidigungen

Anhänge (nur im Buch)

Anhang A —	KI-Sicherheits-Checkliste für Produktionssysteme
Anhang B —	Beispiel-Threat-Model-Vorlage
Anhang C —	Sichere Prompt-Design-Muster

Anhang D —	Incident-Response-Vorlage für LLM-Anwendungen
Anhang E —	Empfohlene Werkzeuge und Frameworks

Physical AI — ein Begleitband

Physical AI ist der Schwesterband zur LLM Primer Serie. Während die sieben Kernbände behandeln, wie generative KI Text, Code und strukturierte Ausgaben produziert, erweitert Physical AI dieselbe mechanismusorientierte Behandlung auf verkörperte Systeme: Roboter, autonome Fahrzeuge und Agenten, die die physische Welt wahrnehmen und in ihr handeln. Wenn dich die nächste Grenze — KI, die sich bewegt, greift und navigiert — interessiert, lies ihn nach oder neben der LLM Primer Serie.

Fang mit Band I an. Zwölf Kapitel, vollständig für 2026 überarbeitet, mit Diagrammen, „In einfacher Sprache"-Kästen, Codebeispielen und einer vollständigen Behandlung dessen, wie generative KI wirklich funktioniert. Hol dir LLM Primer I auf Amazon →

Die LLM Primer Serie

Worum es in dieser Serie geht

Wie du diese Seite liest

Band I — Wie generative KI funktioniert

Teil I — Konzepte und Grundlagen

Teil II — Wie LLMs funktionieren

Teil III — Praktische Perspektiven

Teil IV — Fortgeschrittene Themen

Anhänge (nur im Buch)

Band II — Sprachmodelle durch Mathematik

Teil I — Mathematische Grundlagen

Teil II — Architektur und Mechanik

Teil III — Training und Evaluation

Teil IV — Anwendungen und Praxis

Anhänge (nur im Buch)

Band III — Enterprise-KI mit RAG verstärken

Teil I — Grundlagen von Retrieval-Augmented Generation

Teil II — Daten-Ingestion, Parsing und Chunking

Teil III — Vektordatenbanken und Retrieval-Optimierung

Teil IV — Sicherheit, Datenschutz und Zugriffskontrolle

Teil V — Evaluation, Monitoring und Wartung

Anhänge (nur im Buch)

Band IV — KI-Kognition mit MCP gestalten

Teil I — Der Paradigmenwechsel bei der KI-Integration

Teil II — Kernmechanik des Model Context Protocol

Teil III — Multi-Agenten-Orchestrierungsmuster

Teil IV — KI-Kognition gestalten: Kontext und Gedächtnis

Teil V — Agentische Workflows absichern

Teil VI — Production Engineering und Skalierung

Anhänge (nur im Buch)

Band V — Reale LLM-Anwendungen bauen

Teil I — Grundlagen des AI Engineering

Teil II — Agentische und Retrieval-Fähigkeiten bauen

Teil III — Qualitätssicherung und Observability

Teil IV — Sicherheit, Skalierung und Optimierung

Anhänge (nur im Buch)

Band VI — KI-Systeme skalieren

Teil I — Die Grundlagen der LLM-Inferenz

Teil II — Das Hardware-Substrat

Teil III — Optimierung auf Modellebene (Kompression)

Teil IV — Optimierungen auf System- und Engine-Ebene

Teil V — Serving-Frameworks und Orchestrierung

Teil VI — Anwendungsökonomie und TCO

Anhänge (nur im Buch)

Band VII — KI-Sicherheit

Teil I — Grundlagen der KI-Sicherheit

Teil II — Prompt- und Interaktionssicherheit

Teil III — Modellrobustheit und Verlässlichkeit

Teil IV — Sicherheitsarchitektur auf Systemebene

Teil V — Governance, Ethik und Compliance

Teil VI — Fortgeschrittene Themen

Anhänge (nur im Buch)

Physical AI — ein Begleitband

SHO