Die LLM Primer Serie
Ein Feldhandbuch zur generativen KI, Band fĂŒr Band aufgebaut. Sieben BĂŒcher, jedes mit Fokus auf eine andere Ebene der Arbeit mit groĂen Sprachmodellen.
Worum es in dieser Serie geht
Die LLM Primer Serie ist eine strukturierte, mechanismusorientierte Behandlung groĂer Sprachmodelle â geschrieben fĂŒr Ingenieure, technische Produktmanager, neugierige Fachleute und jeden, der bereit ist, sorgfĂ€ltig zu lesen. Jeder Band behandelt einen Ausschnitt des Feldes in der Tiefe, mit erhaltener technischer PrĂ€zision und ErklĂ€rungen, die so geerdet sind, dass du sie tatsĂ€chlich nutzen kannst.
Die Serie ist so konzipiert, dass sie auf zwei Arten funktioniert. Du kannst Band I als vollstĂ€ndige Grundlage lesen und dort aufhören. Oder du folgst dem gesamten Verlauf â Grundlagen, Mathematik, Retrieval, Kontextdesign, Production Engineering, Skalierung, Sicherheit â und endest mit einem umfassenden praktischen Wissen darĂŒber, wie man verantwortungsvoll mit LLMs baut.
Alle BĂ€nde sind von Sho Shimoda geschrieben, CTO der Receipt Roller Inc., der KI-Systeme in Produktion baut und betreibt und so klar darĂŒber schreibt, dass jeder mitkommt.
FĂŒr wen das ist: Ingenieure und Architekten, die ein nachhaltiges VerstĂ€ndnis wollen. Produktmanager und FĂŒhrungskrĂ€fte, die entscheiden mĂŒssen, welche KI gebaut werden soll. Neugierige Fachleute und Studierende, die die Technologie hinter den Schlagzeilen verstehen wollen. Die Serie ist so geschrieben, dass du keine mathematische Vorbildung brauchst, behĂ€lt aber genug technische PrĂ€zision, dass ein erfahrener Ingenieur seine Zeit nicht verschwendet.
Wie du diese Seite liest
Jeder Band unten listet seine vollstĂ€ndige Gliederung, organisiert nach Teilen. Wir veröffentlichen einen Kapitel-fĂŒr-Kapitel-Begleitartikel fĂŒr jedes Kapitel der Serie. Kapitel, zu denen es bereits einen Begleitartikel gibt, sind verlinkt; Kapitel, deren Begleitartikel noch ausstehen, erscheinen als reiner Text.
Die AnhĂ€nge sind zur Transparenz aufgefĂŒhrt, sind aber buchexklusive Inhalte â Referenzmaterial, Cheat Sheets, Ăbungen mit Lösungen und anderes Material, das ans Ende des Buches gehört statt in einen separaten Begleitartikel. Wer die AnhĂ€nge will, liest das Buch.
Band I â Wie generative KI funktioniert
Ein klarer und praktischer Leitfaden zu den Grundlagen groĂer Sprachmodelle.
Die Auffahrt in einfacher Sprache zur gesamten Serie. Von Null beginnend â Tokens, Training und der einfache Akt, das nĂ€chste Wort vorherzusagen â baut er ein ehrliches, fachjargonfreies Bild davon auf, was ein groĂes Sprachmodell ist, wie es trainiert wird und warum es sich so verhĂ€lt, wie es sich verhĂ€lt, ohne Vorwissen vorauszusetzen. Es ist das Fundament, auf dem jeder spĂ€tere Band aufbaut.
Lies das Buch auf Amazon: LLM Primer I â How Generative AI Works
|
|
EinfĂŒhrung in die Serie: Eine Kapitel-fĂŒr-Kapitel-Tour durch LLM Primer I â EinfĂŒhrung in die Serie und Index
Teil I â Konzepte und Grundlagen
Teil II â Wie LLMs funktionieren
Teil III â Praktische Perspektiven
Teil IV â Fortgeschrittene Themen
AnhÀnge (nur im Buch)
| Anhang A â | LLM-Glossar |
| Anhang B â | Mathematik hinter Attention |
| Anhang C â | Prompting-Cheat-Sheet |
| Anhang D â | Werkzeuge und Bibliotheken |
| Anhang E â | Empfohlene LektĂŒre |
Band II â Sprachmodelle durch Mathematik
Das Innenleben der KI mit mathematischem Einblick erkunden.
Eine mathematisch rigorose, aber lesbare Tour durch das Innenleben der KI: Attention, Optimierungsdynamik, Loss-Landschaften und Skalierungsverhalten, erklĂ€rt durch die Mathematik, die sie zum Laufen bringt. Jede Gleichung, auf die es ankommt, wird vollstĂ€ndig hergeleitet â jede eingebettet in eine Geschichte, eine Analogie und ein durchgerechnetes numerisches Beispiel. FĂŒr Leser, die die Mathematik wollen, die der erste Band in den Seitenleisten lĂ€sst.
Lies das Buch auf Amazon: LLM Primer II â Language Models Through Mathematics
|
|
EinfĂŒhrung in die Serie: Eine Kapitel-fĂŒr-Kapitel-Tour durch LLM Primer II â EinfĂŒhrung in die Serie und Index
Teil I â Mathematische Grundlagen
Teil II â Architektur und Mechanik
Teil III â Training und Evaluation
Teil IV â Anwendungen und Praxis
AnhÀnge (nur im Buch)
| Das LLM-Mathe-Cheat-Sheet |
| Eine statistische Perspektive auf LLMs |
| Fragen, die Menschen stellen |
| Durchgerechnete Herleitungen |
| Ăbungen mit Lösungen |
| Symbolverzeichnis |
| Ein vollstÀndiger Forward Pass, in Zahlen |
| Eine Zeitlinie der Ideen |
Band III â Enterprise-KI mit RAG verstĂ€rken (Jetzt verfĂŒgbar)
Ein praktischer Leitfaden zum Bauen von Retrieval-Augmented-Generation-Systemen fĂŒr das Unternehmen.
Praktische Retrieval-Augmented Generation â Vektordatenbanken, Chunking-Strategien und die Architektur, ein Modell in deinen eigenen Dokumenten zu erden fĂŒr verlĂ€ssliche, aktuelle Enterprise-Antworten. Der Band, den du lesen solltest, wenn dein Job darin besteht, KI-Features auszuliefern, die aktuell bleiben und ihre Quellen zitieren mĂŒssen.
Auf Amazon lesen: LLM Primer III â Enterprise-KI mit RAG
|
|
SerieneinfĂŒhrung: LLM Primer III â SerieneinfĂŒhrung und Index
Teil I â Grundlagen von Retrieval-Augmented Generation
Teil II â Daten-Ingestion, Parsing und Chunking
Teil III â Vektordatenbanken und Retrieval-Optimierung
Teil IV â Sicherheit, Datenschutz und Zugriffskontrolle
Teil V â Evaluation, Monitoring und Wartung
AnhÀnge (nur im Buch)
| Anhang A â | Essentielle mathematische Formeln zur RAG-Optimierung |
| Anhang B â | Beispiel-System-Prompts fĂŒr Datenanonymisierung und Evaluation |
| Anhang C â | Entscheidungsmatrizen fĂŒr Vektordatenbanken und Werkzeuge |
| Anhang D â | Benchmark-DatensĂ€tze fĂŒr RAG-Evaluation |
Band IV â KI-Kognition mit MCP gestalten (Jetzt verfĂŒgbar)
Kontext, Werkzeuge und GedĂ€chtnis fĂŒr zuverlĂ€ssige KI-Agenten engineeren.
Strukturierte Kontextmodellierung und Orchestrierung: wie man das Reasoning eines Modells formt, indem man den Kontext und die Situationen gestaltet, die es sieht â statt das Modell selbst zu Ă€ndern. Der Band, den du lesen solltest, wenn du agentische Systeme baust â Werkzeuginventare, langlaufende Schleifen, GedĂ€chtnis ĂŒber Sessions hinweg und die Disziplin, zu gestalten, was das Modell ĂŒberhaupt sehen darf.
Auf Amazon lesen: LLM Primer IV â KI-Kognition mit MCP entwerfen
|
|
SerieneinfĂŒhrung: LLM Primer IV â SerieneinfĂŒhrung und Index
Teil I â Der Paradigmenwechsel bei der KI-Integration
Teil II â Kernmechanik des Model Context Protocol
Teil III â Multi-Agenten-Orchestrierungsmuster
Teil IV â KI-Kognition gestalten: Kontext und GedĂ€chtnis
Teil V â Agentische Workflows absichern
Teil VI â Production Engineering und Skalierung
AnhÀnge (nur im Buch)
| Anhang A â | MCP-Schnellreferenz und Cheat Sheet |
| Anhang B â | Implementierungs-Blueprints und Code-Beispiele |
| Anhang C â | Production-Readiness- und Sicherheits-Checklisten |
| Anhang D â | Erweiterte Spezifikationen und Standard Enhancement Proposals (SEPs) |
| Anhang E â | Benchmarks und Performance-Daten |
| Anhang F â | Offizielle Ressourcen und Ăkosystem-Links |
Band V â Reale LLM-Anwendungen bauen
LLM-Systeme in Produktion entwerfen, evaluieren und betreiben.
Ein systemfokussierter Leitfaden vom Prototyp zur Produktion â API-Design, Evaluations-Loops, Monitoring und Integration â der ein leistungsfĂ€higes Modell in ein verlĂ€ssliches Produkt verwandelt. Der Band, der architektonisches VerstĂ€ndnis in laufende Dienste mit echten Nutzern umsetzt.
|
|
Teil I â Grundlagen des AI Engineering
| Kapitel 1 â | Die Disziplin des AI Engineering |
| Kapitel 2 â | Foundation Models und Prompt Engineering |
Teil II â Agentische und Retrieval-FĂ€higkeiten bauen
| Kapitel 3 â | Retrieval-Augmented Generation (RAG) |
| Kapitel 4 â | KI-Agenten und Tool Calling |
Teil III â QualitĂ€tssicherung und Observability
| Kapitel 5 â | LLM-Anwendungen evaluieren |
| Kapitel 6 â | KI-Observability und Tracing |
Teil IV â Sicherheit, Skalierung und Optimierung
| Kapitel 7 â | LLM-Sicherheit und Guardrails |
| Kapitel 8 â | Performance, Serving und Kosten optimieren |
AnhÀnge (nur im Buch)
| Anhang A â | Die Production-Readiness- und Sicherheits-Checklisten |
| Anhang B â | Auswahlmatrizen fĂŒr Tools und Frameworks |
| Anhang C â | Protokolle, Streaming und strukturierte Ausgaben |
| Anhang D â | Rate Limiting und Architektur des Kostenmanagements |
| Anhang E â | Glossar der AI-Engineering-Metriken und -Begriffe |
Band VI â KI-Systeme skalieren
Low-Latency-LLM-Inferenz fĂŒr den ProduktionsmaĂstab architektonisch gestalten.
Hochleistungs-Inferenz architektonisch gestalten: verteiltes Serving, Latenzoptimierung und Kostenmodellierung fĂŒr Systeme, die Millionen Mal am Tag antworten mĂŒssen. Der Band, den du liest, wenn dein KI-System ĂŒber einen Server hinausgewachsen ist und sich nun wie ein echtes StĂŒck Infrastruktur verhalten muss.
|
|
Teil I â Die Grundlagen der LLM-Inferenz
| Kapitel 1 â | Die Mechanik der Token-Generierung |
| Kapitel 2 â | Die Key-Value-Cache-Herausforderung |
Teil II â Das Hardware-Substrat
| Kapitel 3 â | Rechenzentrums-GPUs fĂŒr generative KI |
| Kapitel 4 â | Spezialisiertes KI-Silizium und ASICs |
Teil III â Optimierung auf Modellebene (Kompression)
| Kapitel 5 â | Quantisierung entmystifizieren |
| Kapitel 6 â | Pruning und Knowledge Distillation |
Teil IV â Optimierungen auf System- und Engine-Ebene
| Kapitel 7 â | Fortgeschrittene Batching-Strategien |
| Kapitel 8 â | KV-Cache-Management der nĂ€chsten Generation |
| Kapitel 9 â | Speculative Decoding |
Teil V â Serving-Frameworks und Orchestrierung
| Kapitel 10 â | Die LLM-Engine-Schicht |
| Kapitel 11 â | Die Platform- und Orchestrierungsschicht |
| Kapitel 12 â | Disaggregiertes Serving und Kubernetes |
| Kapitel 13 â | Autoscaling und Cold-Start-Minderung |
Teil VI â Anwendungsökonomie und TCO
| Kapitel 14 â | Token-Ăkonomie und API-Pricing |
| Kapitel 15 â | Serverless APIs vs. Dedizierte Infrastruktur |
| Kapitel 16 â | Kostensenkungsstrategien in Produktion |
AnhÀnge (nur im Buch)
| Anhang A â | Mathematische Formeln und Kostenmodellierungs-Referenz |
| Anhang B â | Hardware- und Beschleuniger-Spezifikationsleitfaden |
| Anhang C â | Deployment-Konfigurationen und Code-Snippets |
| Anhang D â | Benchmarking-Methodik und Metrik-Definitionen |
Band VII â KI-Sicherheit
LLM-Systeme gegen Prompt Injection, Jailbreaks und adversariale Bedrohungen verteidigen.
Sichere und robuste KI gestalten: adversariale Risiken, Prompt Injection, Governance-Frameworks und defensives Design fĂŒr Systeme, die in der realen Welt deployt werden. Der Band, den du liest, wenn dein KI-System als sicherheitsrelevante Infrastruktur ernst genommen werden muss.
|
|
Teil I â Grundlagen der KI-Sicherheit
| Kapitel 1 â | Warum KI-Sicherheit anders ist |
| Kapitel 2 â | Threat Modeling fĂŒr LLM-Systeme |
| Kapitel 3 â | Datensicherheit und Datenschutz |
Teil II â Prompt- und Interaktionssicherheit
| Kapitel 4 â | Prompt Injection und Jailbreaks |
| Kapitel 5 â | Eingabevalidierung und Ausgabefilterung |
| Kapitel 6 â | Risiken von Retrieval-Augmented Generation |
Teil III â Modellrobustheit und VerlĂ€sslichkeit
| Kapitel 7 â | Halluzinationen und VerlĂ€sslichkeit |
| Kapitel 8 â | Adversariale Angriffe auf Modelle |
| Kapitel 9 â | ModellintegritĂ€t und Supply-Chain-Risiken |
Teil IV â Sicherheitsarchitektur auf Systemebene
| Kapitel 10 â | Sichere LLM-Architekturen entwerfen |
| Kapitel 11 â | Observability, Logging und Incident Response |
| Kapitel 12 â | Zugriffskontrolle und IdentitĂ€t |
Teil V â Governance, Ethik und Compliance
| Kapitel 13 â | Regulatorische Landschaft |
| Kapitel 14 â | Bias, Fairness und verantwortungsvolle KI |
| Kapitel 15 â | Eine sichere KI-Organisation aufbauen |
Teil VI â Fortgeschrittene Themen
| Kapitel 16 â | Sicheres Fine-Tuning und Adaption |
| Kapitel 17 â | KĂŒnftige Bedrohungen und entstehende Verteidigungen |
AnhÀnge (nur im Buch)
| Anhang A â | KI-Sicherheits-Checkliste fĂŒr Produktionssysteme |
| Anhang B â | Beispiel-Threat-Model-Vorlage |
| Anhang C â | Sichere Prompt-Design-Muster |
| Anhang D â | Incident-Response-Vorlage fĂŒr LLM-Anwendungen |
| Anhang E â | Empfohlene Werkzeuge und Frameworks |
Wie diese Seite wÀchst
Diese Seite wird mit jedem veröffentlichten Band der Serie und mit dem Live-Gehen jedes Kapitel-Begleitartikels aktualisiert. FĂŒr die BĂ€nde III bis VII sind oben die vollstĂ€ndigen Inhaltsverzeichnisse aufgefĂŒhrt; die Begleitartikel zu diesen Kapiteln werden hinzugefĂŒgt, sobald sie geschrieben sind.
Markiere diese Seite als Lesezeichen, wenn du die Serie verfolgen möchtest, wÀhrend sie sich entfaltet. Oder abonniere den Channel-Feed, um jeden neuen Beitrag am Tag seiner Veröffentlichung zu erhalten.
Fang mit Band I an. Zwölf Kapitel, vollstĂ€ndig fĂŒr 2026 ĂŒberarbeitet, mit Diagrammen, "In einfacher Sprache"-KĂ€sten, Codebeispielen und einer vollstĂ€ndigen Behandlung dessen, wie generative KI wirklich funktioniert.
Hol dir LLM Primer I auf Amazon â
Geh dann mit Band II tiefer. Die Mathematik unter der Maschinerie â Attention als Geometrie, Training als Optimierung, Ausrichtung als Statistik. Vierzehn Kapitel, jede wichtige Gleichung vollstĂ€ndig hergeleitet, jede mit einer Geschichte, einer Analogie und einem durchgerechneten Beispiel.
Hol dir LLM Primer II auf Amazon â